OCR, kurz für optische Zeichenerkennung, bezieht sich auf die Technologie, mit der gedruckte, geschriebene oder getippte Zeichen in ein digitales Format konvertiert werden. Der Prozess ermöglicht das Lesen von Text von einem Computer, wodurch die Zeichen bearbeitet und durchsucht werden können. Diese Technologie hat nicht nur die Dateneingabe revolutioniert, sondern ist auch ein hilfreiches Werkzeug für Blinde und Sehbehinderte.
Wie funktioniert OCR?
Nachdem ein Dokument mit einem optischen Scanner gescannt und in Zeichen zerlegt wurde, bietet die OCR-Technologie zwei verschiedene Ansätze zum Konvertieren von Zeichen in eine Mustererkennung mit digitalem Format und zur Erkennung von Merkmalen.
Die Mustererkennung, auch als Matrix-Matching und Pattern-Matching bezeichnet, vergleicht ein gescanntes Zeichen mit einem Rückstand an Zeichenbildern, die das Programm gespeichert hat. Dies funktioniert nur, wenn die Zeichen genau mit den Zeichen übereinstimmen, die die OCR als Referenz verwendet. In den 1960er Jahren wurde die OCR-A-Schriftart erstellt, um auf Schecks gedruckt zu werden, um die Schriftart für die OCR-Programme der Bank zu standardisieren. Schließlich wurde die Mustererkennung auf die Erkennung mehrerer gängiger Schriftarten wie Arial und Times New Roman ausgeweitet. Das Programm beschränkte sich jedoch weiterhin darauf, nur Zeichen zu konvertieren, die in einigen ausgewählten Schriftarten enthalten waren.
Mit der Feature-Erkennung, auch als Feature-Extraktion bezeichnet, kann OCR Zeichen in nahezu jeder Schriftart lesen. Anstatt nach der exakten Replik eines Zeichens zu suchen, unterscheidet die Feature-Erkennung bestimmte Features, die ein Charakter unabhängig von der Schriftart haben wird. Wenn das Programm beispielsweise ein Zeichen mit zwei schrägen Linien scannt, die sich oben treffen, um einen Punkt hervorzuheben, kann es erkennen, dass der Buchstabe ein Großbuchstabe A ist. Die Feature-Erkennung erweitert die Verwendungsmöglichkeiten und Funktionen von OCR-Programmen und ist die größte gängige Art der heute verwendeten OCR.
Obwohl OCR auf die Konvertierung von gedrucktem Text beschränkt ist, kann die intelligente Zeichenerkennung (ICR) die Handschrift in Text umwandeln, der von einem Computer gelesen, durchsucht oder bearbeitet werden kann. Obwohl es sich in derselben Familie wie OCR befindet, ist ICR ein viel schwierigerer Prozess, da die Handschrift vielfältiger ist als die Schriftarten.
Verwendet für OCR
- Dateneingabe
- Helfen Sie Blinden und Sehbehinderten
- Bücher digitalisieren
- Mail-Sortierung
- Machen Sie PDFs, Bücher und physische Dokumente durchsuchbar
- Kennzeichenerkennung
- Passerkennung