OCR als Kernfunktion eines DMS
30. Juni 2022 by Sarah

OCR Texterkennung als Kernfunktion des Dokumentenmanagementsystems


Erfahren Sie in diesem Artikel, was OCR überhaupt ist, wie OCR Software in Docutains DMS arbeitet und welchen Nutzen es für Sie hat.



Was ist OCR?

Die Abkürzung OCR steht für „Optical Character Recognition“, also übersetzt eine optische Zeichenerkennung oder Texterkennung. Die Technologie der Bild- und Texterkennung ermöglicht, dass Texte eines gescannten oder importierten Dokumentes erkannt und extrahiert werden können. So entsteht aus einem vermeintlichen Bild ein maschinencodierter Text.


Wie funktioniert OCR Texterkennung?

Wenn ein Dokument in einem ersten Schritt eingescannt wird, liegt es meist digital als Bild vor. Zunächst handelt es sich dabei um eine sogenannte Rastergrafik, die sich aus verschiedenen Pixeln, Zahlen, einzelnen Buchstaben und Satzzeichen zusammensetzt. Die OCR Technologie sucht das Dokument nun auf erkannte Formen (Merkmalserkennung) und bestimmte Muster (Mustererkennung) ab, die es in einem hinterlegten Katalog gespeichert hat und setzt so die erkannten Zeichenbestandteile zu einem Text zusammen. Auf diese Weise entsteht ein digitaler Text, der weiterbearbeitet oder extrahiert werden kann.

Es gibt als Erweiterung auch die Intelligent Character Recognition, kurz ICR, die in der Lage ist, neben gedruckten Texten auch handschriftliche Notizen oder Briefe in einen maschinenlesbaren Text umzuwandeln. Die Basis ist auch hier eine künstliche Intelligenz, die das Trainieren von Mustern forciert.


Vorteile der OCR-Technologie und Bedeutung

Durch den Einsatz von OCR-Anwendungen wie beispielsweise bei einem Dokumentenmanagementsystem können manuelle oder sich wiederholende Aufgaben automatisiert werden. Hintergrund ist, dass die Texterkennung repetitive Dokumente automatisch erkennt und zuordnen kann und so auch Unterschiede erkennen kann. Klassische Beispiele hierfür sind Rechnungen oder Belege. Dies führt zu einer klaren Produktivitätssteigerung – im beruflichen wie auch privaten Umfeld. Arbeitsabläufe lassen sich so automatisieren. Zudem ist die Dokumentenerfassung deutlich schneller als beim manuellen Erfassen, wodurch eine große Zeitersparnis ermöglicht wird.


Wie wird OCR Software im Alltag eingesetzt?

Die Funktion Texte erkennen mit OCR Programmen ist ein wahrer Alltagsheld.
Klassische Beispiele hierfür sind die Fotoüberweisungen bei mobilen Banking-Apps. Aus der digital vorliegenden Rechnung (PDF Dokument) werden die relevanten Informationen des Dokumentes wie Betrag, IBAN und Verwendungszweck herausgelesen, um das Überweisungsformular auszufüllen. Das erspart das manuelle Abtippen und reduziert die Anzahl der Fehler nachweislich.

Auch im Bereich e-Commerce wird OCR Erkennung vermehrt eingesetzt, indem Kunden beim Bezahlen die Option geboten wird, die Kreditkarte per Kamera einzulesen. Dadurch wird das Bezahlformular dann automatisch ausgefüllt.

Die OCR Funktion ist oftmals auch bei Übersetzer-Apps ein wesentlicher Bestandteil, sofern Foto-Übersetzung genutzt wird. Der Text wird mit der Kamera fotografiert, die Optical Character Recognition läuft über das Dokument und die erkannten Daten werden dann in verschiedene Sprachen (bspw. englisch oder französisch) übersetzt.

Neuere Automodelle sind ebenfalls mit der OCR Technologie ausgestattet, um die Verkehrszeichenerkennung zu ermöglichen. Auch bei der Verkehrsüberwachung kann die OCR Technik zum Einsatz kommen, um die Autokennzeichen zu erfassen.

Im beruflichen Umfeld wird die optische Zeichenerkennung oftmals im Bereich der Buchhaltung angewandt, um Eingangsrechnungen automatisiert zu erfassen und auszulesen.


OCR Texterkennung im Bereich Dokumentenmanagement – Praxisbeispiel Docutain

Neben den oben genannten Alltagsbeispielen bildet die OCR Technologie meist das Herzstück einer Dokumentenmanagement Software, kurz DMS. Dies ist auch beim DMS Docutain der Fall, wobei die Texterkennung in der App und auch bei der Windows Desktop Software gleichermaßen funktioniert. Die App kann im Apple App Store und Google Play Store kostenlos heruntergeladen werden.


Ablauf eines Workflows in Docutain

  1. Ein Dokument wird mit der Docutain-App oder mit einem angeschlossenen Scanner in Docutain eingescannt. Während des Scans startet die OCR Texterkennung, um das Dokument nach bestimmten Informationen, den sogenannten Indexinformationen, zu klassifizieren.

  2. In Docutain hat der Nutzer die Möglichkeit, neben der Benennung des Dokumentes weitere Indexinformationen wie Dokumententyp, Schlagwort, Dokumentendatum, Adresse, Betrag sowie die Kennzeichen „steuerrelevant“ und „bezahlt“ zu setzen. Abgesehen von den Kennzeichen schlägt Docutain automatisch geeignete Indexinformationen anhand der erkannten Informationen des Dokumentes vor, damit der Nutzer diese Daten nicht manuell eintragen muss.

  3. Wiederkehrende Dokumente und Aenderungen werden erkannt Wiederkehrende Dokumente wie beispielsweise die jährliche Stromrechnung oder die monatliche Rechnung des Zeitschriftenabonnements erkennt Docutain ebenfalls und schlägt bei der Indexierung entsprechend zeitlich fortlaufende Benennungen vor. Darüber hinaus erkennt Docutain auch, ob sich bspw. der Rechnungsbetrag geändert hat und zeigt etwaige Erhöhungen an. Dies ermöglicht dem Nutzer eine maximale Transparenz seiner Unterlagen dank des smarten DMS. Weitere Informationen zur automatischen Erkennung der Indexinformationen finden Sie im Hilfecenter.

  4. Ist das Dokument nach der Indexierung in Docutain gespeichert kann es jederzeit in nur wenigen Klicks schnell wiedergefunden werden. Der Grund: In Docutain kann nach erkanntem Text innerhalb eines Dokumentes gesucht werden. Neben vielseitigen Möglichkeiten der Dokumentensuche können Sie also auch direkt eine Volltextsuche eines Dokumentes starten.

Ein weiterer Vorteil bei der Dokumentenverwaltung mit Docutain: Durch die Kombination der Nutzung der OCR App und der Windows Software können Sie gescannte Dokumente jederzeit mit dem Smartphone und am PC finden, einsehen und verwalten.


Rechnungen aus Docutain heraus zur Zahlung anweisen

Ein weiteres Anwendungsbeispiel der Texterkennung in der Docutain App ist die Funktion eine gescannte oder importierte Rechnung aus Docutain zu bezahlen. Der Fokus bei den Rechnungsinformationen liegt auf den Parametern IBAN, Betrag, Empfänger und Verwendungszweck. Diese vier erkannten Parameter werden dem Nutzer in einer Überweisungsvorschau zur Prüfung und angezeigt. Ist der User mit der OCR Erkennung der Daten zufrieden, kann er diese Werte an seine mobile Banking-App weiterleiten. Die Zahlung wird in der Banking App selbst angewiesen und nach erfolgter Zahlung wird in Docutain das Kennzeichen „bezahlt“ an der Rechnung gesetzt.
Aktuell angebundene mobile Banking Apps sind Outbank, StarMoney, finanzblick und Banking4. Weitere Anbindungen sind geplant.


Vorteile der OCR Funktion von Docutain im Überblick


  • Indexinformationen zum Dokument werden automatisch erkannt – Weniger Aufwand & Zeitersparnis für Sie!
  • Dank optischer Zeichenerkennung kann in Docutain eine Volltextsuche des durchsuchbaren PDF Formats gemacht werden – Dokumente finden Sie so in Sekundenschnelle!
  • Dank der automatischen Erkennung der Indexinformation unterstützt Sie Docutain bei Plausibilitätschecks der Dokumente – Ihnen entgeht keine Preiserhöhung!
  • Die OCR Funktion läuft bei Docutain lokal auf dem Gerät – es ist keine Internetverbindung notwendig und es sind keine externen Server oder Drittanbieter involviert – Höchste Sicherheit für Ihre Dokumente!
  • Erkannten Text einer PDF Datei können Sie jederzeit exportieren und versenden – Bleiben Sie flexibel & agil!

Docutains PDF Scanner & OCR SDK

Um die Vorteile der starken Scanfunktionalität und der intelligenten Texterkennung von Docutain auch für andere App- bzw. Softwareanbieter zur Verfügung zu stellen, bietet Docutain ein Scan SDK, ein Texterkennungs-SDK und ein Datenextraktions-SDK an (Software Development Kit).
Weitere Informationen zum SDK-Angebot von Docutain finden Sie hier: Docutain SDK