OCR, Optical Character Recognition (Optische Zeichenerkennung), oder Texterkennung, ist eine Technologie, die die Umwandlung unterschiedlicher Dokumente in bearbeitbare und durchsuchbare Dateien ermöglicht. Diese Dokumente sind beispielsweise gescannte Papierdokumente, PDF-Dateien oder Digitalbilder, handgeschriebene oder gedruckte Texte.

Wer ein PDF bearbeiten möchte, kann wahrscheinlich problemlos Kommentare einfügen. Aber geht es um die Bearbeitung im Layout, dann muss ein PDF mit OCR eingelesen werden, um nach der Texterkennung weiter bearbeitet zu werden.

Was passiert bei der Texterkennung?

Wenn eine Seite gescannt wird, wird es als gerastert vom TIF-Format gespeichert. Der Mensch kann dieses Bild lesen, wenn es auf dem Bildschirm angezeigt wird. Jedoch ist es für den Computer nur eine Reihe von weißen und schwarzen Punkten. Das bedeutet, dass für den Computer jeder Text der gleiche ist. Der Computer sieht auf jede Zeile des Bildes und bestimmt ob die Reihe von Punkten nun einem bestimmten Buchstaben oder einer Zahl entsprechen

Das OCR Programm unterteilt eine Seite in Elemente wie Textblöcke, Tabellen, Bilder usw. Anschließend werden Zeilen in Wörter und schließlich Wörter in Buchstaben aufgeteilt. Wurden erstmal die einzelnen Buchstaben ausgemacht, vergleicht das Programm diese mit einer Reihe von Musterbildern und stellt zahlreiche Hypothesen auf, um welchen Buchstaben es sich hierbei handelt. Basierend auf diesen Hypothesen untersucht das Programm die unterschiedlichen Arten, auf welche Linien in Wörter und Wörter in Buchstaben aufgeteilt werden können. Nach Verarbeitung einer sehr großen Anzahl solcher Wahrscheinlichkeitshypothesen trifft das Programm schließlich eine Entscheidung und präsentiert den erkannten Text.“

Wenn der Text digitalisiert ist, kann er elektronisch durchsucht und bearbeitet werden, kompakter gespeichert und online angezeigt werden. Es ermöglicht den Daten in Maschinenprozessen wie Text-zu-Sprache, maschinelle Übersetzung und Text Mining verwendet zu werden.

Vorteile des OCR
  1. Daten suchen/ manipulieren: durch die Erstellung einer Textversion kann eine Textsuche gemacht werden und das Dokument in einem Textverarbeitungsprogramm bearbeitet werden
  2. Hilfe für Blinde und Sehbehinderte: Screenreader können maschinenlesbaren Text entschlüsseln und die Worte auf dem Bildschirm verständlich für blinde und sehbehinderte Menschen auslesen.
  3. Schnelle Dateneingabe: kann Effektivität und Effizienz bei Büroarbeit verbessern.

Abschließend ist zu sagen, dass es sowohl kostenfreie als auch kostenpflichtige Texterkennungsprogramme gibt, welche auf die unterschiedlichen Bedürfnisse ausgerichtet sind.

Ihr Future-Law Team,

Sophie Martinetz & Sophie Werner

  Sophie Werner