CMO:Wie kommen die Gedichte in CMO: Unterschied zwischen den Versionen
UweS (Diskussion | Beiträge) Die Seite wurde neu angelegt: „==Scannen== ist der erste Schritt. Ich arbeite mit einem [https://plustek.com/deu/products/book-scanners/opticbook-4800/index.php Plustek OpticBook 4800] mit folgenden Einstellungen * Graustufen * 300 oder 400 dpi * abgespeichert als PNG Bücher werden mit dem Pfalz an die Seite der Scheibe gedrückt, was dazu führt, dass jede 2. Seite um 180° gedreht ist. Das kann die Scansoftware“ |
UweS (Diskussion | Beiträge) Keine Bearbeitungszusammenfassung |
||
| Zeile 4: | Zeile 4: | ||
* 300 oder 400 dpi | * 300 oder 400 dpi | ||
* abgespeichert als PNG | * abgespeichert als PNG | ||
Bücher werden mit dem Pfalz an die Seite der Scheibe gedrückt, was dazu führt, dass jede 2. Seite um 180° gedreht ist. Das kann die Scansoftware | Bücher werden mit dem Pfalz an die Seite der Scheibe gedrückt, was dazu führt, dass jede 2. Seite um 180° gedreht ist. Das kann die Scansoftware zwar automatisiert drehen, aber es ist kompliziert zu handhaben. das Drehen erledige ich dann mit [https://irfanview.de IrfanView]. | ||
== OCR == | |||
Optical Character Recognition, Zeichenerkennung mache ich mit Abbyy finreader. Die Software analysiert automatisch zuerst die Textform. Aber es muss jede Seite nachbearbeitet werden, damit wirklich alles erfasst wird. Die folgende Texterkennung bedingt, dass man die verwedneten Sprachen auch einstellt, an griechisch muss man also auch denken. | |||
Nach der Texterkennung kann per Hand korrigiert werden. Hier such ich nicht nach Fehlern, sondern vereinheitliche die Optik - Geviertstriche — werden zu Munuszeichen - und die französische Anführungszeichen «», werden zu den regulären ". Ellipsen … werden aufgelöst zu drei einzelnen Punkten .... Die Orthogrphie wird beibehalten. | |||
Abgespeichert wird als pdf, wobei unter der Bilddatei der Text liegt | |||
Version vom 7. Mai 2026, 10:56 Uhr
Scannen
ist der erste Schritt. Ich arbeite mit einem Plustek OpticBook 4800 mit folgenden Einstellungen
- Graustufen
- 300 oder 400 dpi
- abgespeichert als PNG
Bücher werden mit dem Pfalz an die Seite der Scheibe gedrückt, was dazu führt, dass jede 2. Seite um 180° gedreht ist. Das kann die Scansoftware zwar automatisiert drehen, aber es ist kompliziert zu handhaben. das Drehen erledige ich dann mit IrfanView.
OCR
Optical Character Recognition, Zeichenerkennung mache ich mit Abbyy finreader. Die Software analysiert automatisch zuerst die Textform. Aber es muss jede Seite nachbearbeitet werden, damit wirklich alles erfasst wird. Die folgende Texterkennung bedingt, dass man die verwedneten Sprachen auch einstellt, an griechisch muss man also auch denken.
Nach der Texterkennung kann per Hand korrigiert werden. Hier such ich nicht nach Fehlern, sondern vereinheitliche die Optik - Geviertstriche — werden zu Munuszeichen - und die französische Anführungszeichen «», werden zu den regulären ". Ellipsen … werden aufgelöst zu drei einzelnen Punkten .... Die Orthogrphie wird beibehalten.
Abgespeichert wird als pdf, wobei unter der Bilddatei der Text liegt