Digitale Workflows

Richtiges Scannen für OCR-Texterkennung

Je besser die Scanqualität ist, desto besser funktioniert auch das Auslesen von Daten aus den digitalisierten Dokumenten.

Mit 120 Einzel- oder 240 Doppelseiten pro Minute scannen die integrierten Scanner der RICOH Multifunktionssysteme. Der automatische Dokumenteneinzug scannt in einem Durchlauf Vorder- und Rückseite. Das spart enorme Arbeitszeit!

Mobile Scan-Lösungen über App bzw. Software integrieren Handy bzw. Tablet und ermöglichen selbst Dokumenten-Erfassung im Homeoffice oder von unterwegs.

Wie schnell und exakt das Auslesen abläuft, hängt von verschiedenen Faktoren ab.

Welches Dateiformat?


Bei der Frage des Dateiformats ist wichtig, was mit dem gescannten, also digitalisierten Dokument geschehen soll. 

Aus vielen Dokumenten z.B. Rechnungen werden direkt beim Scanvorgang automatisch Daten ausgelesen und an DMS oder ERP für Indexierung oder Workflows übergeben. Wenn Text oder Barcodes aus einem Dokument ausgelesen wurden, empfiehlt es sich, für die weitere Verarbeitung, das Dokument im Format PDF/A abzuspeichern. 

Soll ein Dokument, z.B. Pläne nur angezeigt oder versandt werden, stehen Ihnen alle gängigen Dateiformate zur Verfügung, neben PDF und PDF/A sind das zum Beispiel PNG, JPEG oder TIFF.

Farbmodus je nach Bedarf


Bei manchen Dokumentarten kann die Einstellung „Farbe“ sinnvoll sein, zum Beispiel wenn Verträge einem Rechtesystem folgend mit unterschiedlichen Stiftfarben unterzeichnet wurden oder wenn Pläne mit einem Farbschema digitalisiert werden.

In den meisten Fällen reicht aber der Modus Schwarz-Weiß oder Graustufen völlig aus. Allerdings haben Schwarz-Weiß-Scans den großen Vorteil, dass sie den geringsten Speicherplatz beanspruchen.

Die richtige Auflösung


Entscheidend für optimales Indexieren ist die Auflösung des Dokuments. Sie bezeichnet die Punktdichte der Datei und wird in dpi gemessen, „dots per inch“. Für optimale Ergebnisse empfiehlt sich eine Auflösung von mindestens 300 dpi. Bei zu geringer Auflösung können leicht Fehler bei der Zeichenerkennung (OCR) auftreten. Dann wird zum Beispiel „i“ oder „!“statt „I“ ausgelesen oder statt „w“ zweimal ein „v“.

Unterscheiden wir bei der Auflösung nach Farbmodus, sind bei Schwarz-weiß-Scans 300 oder 400 dpi zu empfehlen. Für Graustufen- und Farbscans genügen häufig bereits 150 bis 300 dpi.

Ein weiterer Faktor ist die Schriftgröße des Dokuments. Nehmen Sie als Richtwert: Je kleiner die Schrift, desto höher sollte die Auflösung sein.

Im Schwarz-Weiß-Modus werden die Buchstaben „Ilti“ erst ab 300 dpi klar erfasst. Im Graustufen-Modus sind die Zeichen zwar schon bei 75 dpi gut zu erkennen, es kommen aber Bildinformationen mit, wie hier die Struktur des Papiers, die die Datei vergrößern und unnötig Speicherplatz beanspruchen.

Optimale Einstellung per Tastendruck


Per Direktwahltaste am Multifunktionssystem belegen wir folgende Voreinstellungen:

  • Einzel-/Doppelseiten
  • SW/ Farbe
  • Auflösung
  • Dokumentenart
  • Speicherort z.B. direkt in DATEV oder DocuWare

In einem Schritt: Scannen und konvertieren in bearbeitbare Formate
PDF (durchsuchbar), PDF/A (revisionssicher), Word oder Excel.

Unser Experten-Team stellt Ihnen anhand Ihrer Prozesse bzw. Workflows die passende Lösung zusammen – selbstverständlich mit Konfiguration und Integration in Ihre bestehende Unternehmens-IT. Sprechen Sie uns an.

© 1957 - 2023 Werner Tantzky GmbH