CMO:Wie kommen die Gedichte in CMO: Unterschied zwischen den Versionen

Version vom 7. Mai 2026, 10:56 Uhr

Scannen

ist der erste Schritt. Ich arbeite mit einem Plustek OpticBook 4800 mit folgenden Einstellungen

Graustufen
300 oder 400 dpi
abgespeichert als PNG

Bücher werden mit dem Pfalz an die Seite der Scheibe gedrückt, was dazu führt, dass jede 2. Seite um 180° gedreht ist. Das kann die Scansoftware zwar automatisiert drehen, aber es ist kompliziert zu handhaben. das Drehen erledige ich dann mit IrfanView.

OCR

Optical Character Recognition, Zeichenerkennung mache ich mit Abbyy finreader. Die Software analysiert automatisch zuerst die Textform. Aber es muss jede Seite nachbearbeitet werden, damit wirklich alles erfasst wird. Die folgende Texterkennung bedingt, dass man die verwedneten Sprachen auch einstellt, an griechisch muss man also auch denken.

Nach der Texterkennung kann per Hand korrigiert werden. Hier such ich nicht nach Fehlern, sondern vereinheitliche die Optik - Geviertstriche — werden zu Munuszeichen - und die französische Anführungszeichen «», werden zu den regulären ". Ellipsen … werden aufgelöst zu drei einzelnen Punkten .... Die Orthogrphie wird beibehalten.

Abgespeichert wird als pdf, wobei unter der Bilddatei der Text liegt

@@ Zeile 4: / Zeile 4: @@
 * 300 oder 400 dpi
 * abgespeichert als PNG
-Bücher werden mit dem Pfalz an die Seite der Scheibe gedrückt, was dazu führt, dass jede 2. Seite um 180° gedreht ist. Das kann die Scansoftware
+Bücher werden mit dem Pfalz an die Seite der Scheibe gedrückt, was dazu führt, dass jede 2. Seite um 180° gedreht ist. Das kann die Scansoftware zwar automatisiert drehen, aber es ist kompliziert zu handhaben. das Drehen erledige ich dann mit [https://irfanview.de IrfanView].
+== OCR ==
+Optical Character Recognition, Zeichenerkennung mache ich mit Abbyy finreader. Die Software analysiert automatisch zuerst die Textform. Aber es muss jede Seite nachbearbeitet werden, damit wirklich alles erfasst wird. Die folgende Texterkennung bedingt, dass man die verwedneten Sprachen auch einstellt, an griechisch muss man also auch denken.
+Nach der Texterkennung kann per Hand korrigiert werden. Hier such ich nicht nach Fehlern, sondern vereinheitliche die Optik - Geviertstriche — werden zu Munuszeichen - und die französische Anführungszeichen «», werden zu den regulären ". Ellipsen … werden aufgelöst zu drei einzelnen Punkten .... Die Orthogrphie wird beibehalten.
+Abgespeichert wird als pdf, wobei unter der Bilddatei der Text liegt