Published On: 23. September 2024Von

IDP ist Haupttrend beim Klassifizieren

Mit den Fortschritten im Bereich Künstliche Intelligenz (KI) wachsen auch die Möglichkeiten bei der Erfassung und Automatisierung von unstrukturierten Dokumenten. Auf dieser Basis hat sich die Produktkategorie Intelligent Document Processing (IDP) entwickelt.

Per IDP auch Handschriftliches erkennen

09-18-24-IDP-Formular

Per IDP auch Handschriftliches erkennen (Bild: Kodak Alaris)

Kennzeichen von IDP-Lösungen

Capture-Lösungen, die KI in höherentwickelter Form einbinden, fallen unter den Begriff Intelligent Document Processing (IDP). Sie besitzen fortschrittliche Analytics-Fähigkeiten und bieten Möglichkeiten, um dokumentenbezogene Geschäftsprozesse zu automatisieren. Zu den stark zunehmenden Lösungen im Bereich IDP haben wir auf ECMGUIDE eine neue Produktübersicht gestartet, die kontinuierlich aktualisiert und erweitert wird.

KI, die hier zum Tragen kommt, umfasst beispielsweise generative KI, Retrieval Augmented Generation (RAG) und die Verbindung zu Services führender KI-Anbieter. Gala Spasova, Senior Research Manager von IDC, ergänzt: »KI-Software für das Verstehen von Dokumenten nutzt eingebettete Technologien aus den Teilmärkten Konversations-KI und KI-Tools für computerbasiertes Sehen (Computer Vision, CV). Es können auch Lösungen wie Natural Language Processing (NLP), Ontologien und Sprachanalyse zum Einsatz kommen, um Informationen aus gescannten Dokumenten und/oder Bildern von Dokumenten zu gewinnen.« Anbieter, die KI-Technologien zum Verstehen von Dokumenten einsetzen, untersuchen und integrieren Spasovas Erfahrung nach, zunehmend generative KI (GenAI) und große Sprachmodelle (LLMs), um zusätzliche Softwarefunktionen und -fähigkeiten bereitzustellen, darunter semantisches Verständnis, Dokumentenabfragen und erweiterte Entitätsextraktion.

Leistungsumfang von IDP-Lösungen

Allerdings sind für grundlegende Anforderungen an die Dokumentenverarbeitung auch gewöhnliche Capture-Systeme ausreichend, die wir in einer Produktübersicht ebenfalls ausführlich darstellen. Dagegen empfehlen sich IDP-Lösungen für komplexe Dokumentenprozesse, die ein Verständnis des Kontexts und die Extraktion spezifischer Informationen aus den Dokumenten erfordern. Außerdem sollte man sie in Betracht ziehen, wenn das Ziel darin besteht, End-to-End-Geschäftsprozesse zu automatisieren, welche Dokumente einbeziehen wie bei der automatischen Rechnungsverarbeitung, Compliance-Prüfungen und Customer Onboarding.

Automatisierte Workflows realisiert beispielsweise der Softwarehersteller SER, indem er IDP direkt in seine Content-Services-Plattform integriert. Damit ist folgendes Beispielszenario möglich: Ein Bewerbungsschreiben wird als Papierdokument gescannt, OCR-gelesen oder als E-Mail importiert, im Archiv gespeichert und an die Cloud Capture Plattform beziehungsweise on-premises zur weiteren Verarbeitung übergeben. Bei der Inhaltsanalyse erkennt »Doxis« von SER automatisch die Dokumentart (Bewerbung), den Absender (Bewerber XY) und ermittelt selbstständig den zuständigen HR-Mitarbeiter. Aus diesen Informationen generiert das System einen Vorgang, der in den Postkorb des betreffenden Mitarbeiters eingestellt wird. Der Vorgang enthält neben dem gescannten Schreiben einen Link auf die entsprechende Stellenanzeige, wo mit den extrahierten Bewerberdaten auf Wunsch für jeden Bewerber automatisch eine Bewerberakte angelegt werden kann.

Einsatzfälle für IDP-Systeme

Generell eignen sich IDP-Lösungen am besten für die schnelle und effiziente Verarbeitung großer Mengen von Dokumenten bei minimalem menschlichem Eingriff. Da ihr Einsatz aber auch teurer und komplizierter werden kann, sollten sich Unternehmen überlegen, ob sich der Aufwand lohnt.

Laut der IDC-Expertin Spasova wird IDP für Unternehmen interessant, »die mit großen Mengen unterschiedlicher Dokumente, komplexen Anforderungen an die Datenextraktion, hohen Genauigkeitsanforderungen und der Integration der Dokumentenverarbeitung mit anderen Geschäftssystemen und Workflows zu tun haben. IDP ist auch vorteilhaft für Unternehmen, die strenge Compliance- und Sicherheitsanforderungen erfüllen müssen, die ihre Betriebskosten senken und ihre Effizienz durch Automatisierung verbessern wollen. Ebenso eignen sie sich für Unternehmen, die ein Wachstum ihrer Dokumentenverarbeitungsanforderungen erwarten und eine skalierbare Lösung benötigen.«

Damit die Daten aus den Dokumenten aber erstmal in die Capture- oder IDP-Systeme gelangen, ist neben digitalen Input-Kanälen wie E-Mail und Webportalen häufig ein Scan-Prozess vorgelagert. Da viele Vorgänge beziehungsweise Archive noch papierbasiert sind, kommen hier oftmals Hochleistungsscanner zum Einsatz. Sie können mehrere hundert DIN A4-Seiten pro Minute und rund 100.000 pro Tag verarbeiten.

Weitere Artikel

About the Author: Annette Stadler

Annette Stadler ist IT-Journalistin und leitet das Online-Portal ECMGUIDE.
Nach oben