Mit Künstlicher Intelligenz auf dem Weg zum papierlosen Büro

Bildquelle 1: Canva

Haben Sie einmal nachgezählt, wie viele Briefe und Belege in Papierform täglich bei Ihnen im Unternehmen eingehen? Auch wenn bereits viele Daten digital übermittelt werden, bleibt oft noch ein großer Teil klassischer Briefpost übrig, die bearbeitet und abgelegt werden muss. Dieses Aufkommen zu bewältigen ist mühsam, monoton und kostet viel Zeit. Wie kann diese Lücke hin zur digitalisierten Geschäftswelt geschlossen werden?

Auch wenn die Papierflut von externen Quellen nicht komplett eliminiert werden kann, spricht vieles dafür die Dokumente zu digitalisieren und sie auf diesem Wege den weiteren Prozessbeteiligten zur Verfügung zu stellen. Die Papiere können auf Ihrer Reise von A nach B nicht mehr verloren gehen, schnell und gegebenenfalls auch parallel bearbeitet werden. Ein weiterer Aspekt, der in der Corona Pandemie enorm an Bedeutung gewonnen hat, ist der ortsunabhängige Zugriff auf wichtige Informationen und Dokumente.

Der erste Schritt zu digitalen Dokumenten

Inzwischen gibt es viele Möglichkeiten Papierdokumente zu digitalisieren und für eine Weiterverarbeitung im Unternehmen nutzbar zu machen. Der erste Schritt ist das einscannen der Dokumente. Das klappt heute mit dem Smartphone genauso wie mit dem Multifunktionsgerät. Allerdings lauert hier häufig schon das erste Hindernis. Vielleicht kennen Sie folgende Situation: Sie scannen ein mehrseitiges Dokument, können in der Datei dann aber weder den Text kopieren, Passagen markieren, noch nach bestimmten Wörtern suchen. Ursache ist die Ausgabe als Bilddatei, z. B. als Image-PDF oder JPG. Eine Maschine kann den Text nicht „lesen“ wie der Mensch, sondern erkennt nur Pixel in einem Bild. Für die internen Prozesse bedeutet das, dass bestimmte Inhalte wie beispielsweise Rechnungsnummern trotz digitalem Dokument wieder per Hand abgetippt werden müssen, um sie in andere Programme zu übertragen. Hier schleichen sich gern mal Fehler und Zahlendreher ein.

Abbildung 1: Links: nicht durchsuchbare PDF-Version eines Artikels. Rechts: OCR-Version, mit Text der durchsucht und markiert werden kann (Quelle: Computerbild)

Mit OCR-Software Textinformationen wiedergewinnen

Das Schlüsselwort, um dieses Hindernis zu überwinden, heißt „OCR“ (Optical Character Recognition), auf Deutsch „Optische Zeichen- oder Texterkennung“. Mithilfe dieser Technologie können die Textinformationen in gescannten Papierdokumenten, Image-PDF-Dateien und digitalen Bildern wiedergewonnen werden. Die Dateien werden durchsuchbar und die Textinhalte können von anderen Anwendungen weiterverarbeitet werden.

Die Auswahl an OCR-Software ist inzwischen groß. Von einfachen, kostenlosen Smartphone-Apps die per Fotoaufnahme funktionieren über Open Source Software bis hin zu Desktop Business-Anwendungen. Je größer die Auswahl, desto wichtiger ist es, im Vorfeld genau zu bestimmen, welche Anforderungen die OCR-Software erfüllen muss. Handelt es sich beispielweise nur um deutschsprachige Dokumente oder müssen auch andere Sprachen und Schriftzeichen erkannt werden? Geht es nur um gedruckten Text? Gerade Handschrift ist für OCR-Software immer noch problematisch und liefert meistens keine befriedigenden Ergebnisse, auch wenn die Forschung in diesem Bereich stets voranschreitet. Welches Ausgabeformat muss unterstützt werden? Reicht es aus, die OCR-Ergebnisse in die PDF-datei einzubetten oder muss eine separate Datei erstellt werden, um sie nachfolgenden Anwendungen als Input zur Verfügung zu stellen? Auch die Erkennungsrate ist ein wichtiges Kriterium. Gerade durch den Einsatz von KI, speziell neuronaler Netze, konnte die Genauigkeit in den vergangenen Jahren deutlich verbessert werden. Die Angaben der Hersteller sind jedoch mit Vorsicht zu genießen und variieren je nach verwendeter Messmethode. Zudem hängt die tatsächliche Erkennungsrate maßgeblich von der Qualität der Vorlage und des Scanners ab.

Eine Übersicht und ein Vergleich gängiger Anbieter finden Sie hier: https://www.heise.de/download/specials/Die-beste-Texterkennungssoftware-OCR-Tools-im-Vergleich-6206190

Entscheidend ist ebenso, ob eine reine OCR-Anwendung, die Bilder in Textinformationen umwandelt, für den jeweiligen Fall ausreicht. Denn die Software gibt zwar den erkannten Text wieder, „versteht“ ihn aber nicht. Für ein digitales Archiv kann das bereits ausreichen. Sollen die Dokumente automatisiert weiterverarbeitet werden, sind jedoch weitere Anwendungen nötig. Mit Hilfe von KI-Technologien können die relevanten Informationen klassifiziert, kategorisiert und extrahiert werden. Diesem Bereich widmen wir uns in einem späteren KI-Blogbeitrag.

OCR-Software kann ein erster Schnitt und ein hilfreiches Werkzeug sein, um eine Brücke zwischen Papier und digitaler Welt zu schlagen. Sehen Sie hier Potenzial für eine Anwendung in Ihrem Unternehmen? Kontaktieren Sie uns gern und wir besprechen Ihre individuellen Anforderungen.

Möchten Sie mehr über die Möglichkeiten und Anwendungsbereiche erfahren, besuchen Sie auch gern unseren Workshop (https://www.kompetenzzentrum-cottbus.digital/Veranstaltungen/event/176).

Zur Startseite