Künstliche Intelligenz und Enterprise Content Management

KI bei Datenextraktion aus Dokumenten zur Klassifizierung (Bild: Mindbreeze)

24087-Klassifizierung

KI bei Datenextraktion aus Dokumenten zur Klassifizierung (Bild: Mindbreeze)

In sozialen Medien, bei Navigationsgeräten, in der Spracherkennung und der Medizin – Künstliche Intelligenz oder KI findet in einigen Bereichen bereits Anwendung oder es wird zumindest intensiv damit experimentiert. Auch im Bereich Enterprise Content Management (ECM) arbeiten Produkte mit KI-Technologie. Ein Schwerpunkt bei der KI-Unterstützung stellt im Input-Segment die Extraktion von Metadaten aus Dokumenten dar. »Hier ist die Anwendung im Wesentlichen auf die automatische Rechnungslesung begrenzt«, meint Christian Burkamp, Bereichsleiter Forschung und Entwicklung bei Ceyoniq Technology. »Weitere Teilbereiche wie das automatische Auslesen von Daten aus Verträgen sind in Arbeit, aber hier werden oft auch Methoden der Sprachanalyse benötigt, die in der etablierten Rechnungsverarbeitung gar nicht relevant sind.«

Grundlage für das Auslesen von Rechnungsdaten oder bestimmten Werten in formularähnlichen Vorlagen ist Software für die optische Zeichenerkennung (Optical Character Recognition, OCR). Je mehr Anwender OCR-Systeme nutzen oder trainieren, desto bessere Resultate liefern sie. KI-Systeme können helfen, den Trainingsprozess zu beschleunigen. »Wenn ein KI-System für einen bestimmten Anwendungsbereich bereits ausreichend trainiert geliefert wird, dann kann der Einsatz tatsächlich ganz einfach sein. Das System wird dann aber entsprechend teuer«, merkt Burkamp an.

RPA und CDA zur intelligenten Erfassung

Automatisierbare Erfassungslösungen, die bestimmte KI-Technologien beziehungsweise Softwareroboter in Verbindung mit OCR verwenden, fallen unter den Begriff Robotic Process Automation (RPA). Solch eine universelle Erfassungslösung hat beispielsweise der ECM-Anbieter Hyland für das erste Quartal 2019 angekündigt. Sie soll Informationen aus formularähnlichen Vorlagen in beliebigen externen und internen Systemen und web-basierten Applikationen automatisiert erfassen, analysieren und in Prozesse integrieren. Anwender ohne Programmierkenntnisse können der Lösung beispielsweise per Mausklicks lernen, welche Daten aus einer Vorlage auszulesen sind. Ähnliches bietet beispielsweise auch Kofax mit »Kofax Kapow«.

Karl Heinz Mosbach, Geschäftsführer ELO Digital Office (Bild: ELO)

23782-ELO-Karl-Heinz-Mosbach

Karl Heinz Mosbach, Geschäftsführer ELO Digital Office (Bild: ELO)

Im ECM-Bereich geht es mit KI nicht nur um das Auslesen bestimmter Werte, sondern auch um die automatische Erkennung von Dokumententypen beim Inputmanagement. So kommt KI bei der intelligenten Klassifizierung im digitalen Posteingang zum Einsatz. »Damit lässt sich zum Beispiel bei einer E-Mail feststellen, zu welchem Prozess sie gehört und in welchem Kontext sie steht«, erklärt Karl Heinz Mosbach, Geschäftsführer von ELO Digital Office. »So werden bereits im Vorfeld Informationen intelligent analysiert, um den Mitarbeiter im Arbeitsprozess bestmöglich zu unterstützen. Ziele sind, eine eindeutige Zuordnung zu treffen, wohin eine Information gehört und alle erforderlichen Maßnahmen einzuleiten. So soll beispielsweise eine Reklamation oder eine Produktanfrage automatisch in die richtigen Kanäle unterbrechungsfrei gelenkt werden, um eine schnelle Bearbeitung sicherzustellen.«

Als Beispiel stellte Kofax mit »Cognitive Document Automation (CDA)« vor kurzem eine Erweiterung seiner Robotic-Process-Automation- (RPA-) Lösung vor, die die automatisierte Erfassung von unstrukturierten Informationsquellen wie Dokumenten und E-Mail-Anhängen ermöglicht. Während RPA-Lösungen nur selektive Werte aus strukturierten Vorlagen erfassen können, soll das CDA-Tool aufgrund von KI auch inhaltliche Zusammenhänge aus unstrukturierten Informationsquellen wie E-Mails und Dokumenten herstellen. Laut Kofax bedient sich CDA der Machine Learning-Technologie und Natural Language Processing (NLP). Das System lernt selbstständig und kann dadurch erkennen, um welche Art von Dokument es sich handelt. Auch wenn beispielsweise ein großer Unterschied zwischen einer Rechnung und einer Beschwerde besteht, könnten beide Dokumente denselben Betreff haben. Dank NLP soll eine zuverlässige Unterscheidung möglich sein, nach der das System das Dokument an die richtigen Benutzer oder Abteilungen weiterleitet.

KI bei Analytics und Enterprise Search

Auch das Stuttgarter ECM-Unternehmen ELO entwickelt in Richtung neuronale Netzanalysemethoden und intelligente Agenten, um sie mit E-Mail-Management-Produkten zu verbinden. Dadurch verwenden die Lösungen immer mehr Systeme, die sich kontextbezogen verbessern und selber lernen. Ohne KI aber auch mit modernen Analysefunktionen ausgestattet, ist das bereits verfügbare »ELO Analytics«, das in der »ELO ECM Suite« integriert ist. Damit können Anwender zum Beispiel aus dem Dashboard einer Risikoanalyse mit einem Klick alle Verträge einer laufenden Vertragsakte öffnen und ein Kündigungsverfahren einleiten.  Es lassen sich alle möglichen Datenquellen wie Rechnungen, digitale Akten und E-Mails für Analysen nutzen. Eine zusätzliche Business-Intelligence-Komponente lässt sich unter Umständen einsparen. Neben Analysefunktionen ist eine hochperformante Suche Grundlage hierfür.

Proaktive Suche beim Ticketing mit Insight Engines (Bild: Mindbreeze)

24087-Insight-Engine

Proaktive Suche beim Ticketing mit Insight Engines (Bild: Mindbreeze)

Allgemein gilt der Bereich Enterprise Search, der auch im ECM-Umfeld eine zunehmende Rolle spielt, als weiteres Anwendungsgebiet von KI. So hat sich Mindbreeze, die zu 76 Prozent zum österreichischen ECM-Konzern Fabasoft zählt, auf die Herstellung von Insight Engines spezialisiert. Insight Engines sind intelligente Suchsysteme, die eine rasche Bereitstellung relevanter Informationen zum benötigten Zeitpunkt und richtigen Kontext ermöglichen. Sie profitieren von den Möglichkeiten künstlicher Intelligenz und können in unterschiedlichen Abteilungen wie Kundenservice, Posteingangsstellen und Personalwesen zum Einsatz kommen. Die Quellen werden über Konnektoren angebunden, so dass der Inhalt anschließend der Insight Engine zur Analyse zur Verfügung steht. Wird eine Suchanfrage gestellt, durchsucht die Insight Engine beispielsweise angeschlossene E-Mail-Programme, Fachanwendungen, Datenbanken, Archive, Social-Media-Kanäle oder das Intranet. Sämtliche Daten, die der Anfrage entsprechen, werden in die Suche miteingebunden, Informationen extrahiert, analysiert und aufbereitet. Mindbreeze bietet  Insight Engines sowohl als Cloud- als auch als Appliance-Lösung an.

Unter das Stichwort Suche lassen sich auch Discovery-Lösungen einordnen, wie sie beispielsweise der ECM-Primus OpenText liefert, der hierzu 2016 Recommind und 2017 Guidance Software übernahm. Discovery-Lösungen bieten digitale Forensik sowie Analysen unstrukturierter Daten für die Suche, Erfassung und Auswertung von Unternehmensdaten zur Handhabung gesetzlicher Verpflichtungen und Risiken. Die aus den Opentext-Übernahmen entstandene eDiscovery-Plattform »OpenText Axcelerate« adressiert die Bereiche Advanced Analytics und Predictive Coding. Die Lösung basiert unter anderem auf maschinellem Lernen. Sie hilft Rechts- und Compliance-Abteilungen dabei, schnell wichtige Informationen für die Ermittlung von Rechtsstreitigkeiten, Untersuchungen, Compliance-Analysen, Reaktion auf Datenschutzverletzungen, Business-Projekte und Vertragsanalysen im Finanzbereich zu finden.

KI-Plattformen in Verbindung mit ECM

Präsentation des Magellan-Beispiels Tata von Opentext (Bild: A.Stadler)

23916-Opentext-Enterprise-World

Präsentation des Magellan-Beispiels Tata von Opentext (Bild: A.Stadler)

Den größten Vorstoß in Sachen KI macht Opentext jedoch mit seiner KI- und Analytics-Plattform »Magellan«. Ähnlich wie bei der Watson-Technologie von IBM sind unterschiedlichste Anwendungen möglich. So nutzt der indische Automobilhersteller Tata Magellan-Technologie beispielsweise in Fahrzeugen der Marke Land Rover. Hierbei werden Daten aus diversen Sensoren verwendet, um verschiedenste Analysen durchzuführen. Damit lassen sich technische Fehler auffinden und vorbeugen, Informationen für das Flottenmanagement einholen, Routensteuerung und viele andere Fahrzeug-bezogene Analysen umsetzen. Die Magellan-Technologie von Opentext wurde auch im Rahmen des im Juni 2018 stattgefundenen G7-Gipfels in Kanada verwendet. Im Auftrag der Regierung erstellte Opentext eine Lösung, mit der die Meinung der Öffentlichkeit zu Themen rund um das Gipfeltreffen zu verfolgen war. Gesammelt und ausgewertet wurden hierzu Artikel, Tweets und andere Social-Media-Kommentare. Kommerziell im Einsatz ist Magellan auch beim kalifornischen Weingut E.&J. Gallo Winery. Per Sensoren überwacht der Weinbauer das Wachstum der Rebstöcke bezüglich Feuchtigkeit, Bodenqualität, Krankheiten und Insektenbefall und stellt deren Bewässerung und Pflege genauestens auf die Daten ein. KI kommt ins Spiel, um bessere Trendaussagen für die  Zukunft treffen zu können und vorherzusagen, wie sich beispielsweise eine Trockenperiode langfristig auf die Weinqualität auswirkt. Zudem untersucht Gallo mit Hilfe von Magellan die Reaktion von Kunden in den sozialen Medien, um zum Beispiel herauszufinden, wie neue Sorten aufgenommen werden.

Um KI-Projekte ähnlich wie diese aufzusetzen, stehen heute bereits einige kostenlose  Open-Source-Frameworks zur Verfügung.  »Die populärsten Pakete wie »TensorFlow« oder »Torch« bieten alle relevanten Algorithmen fertig zur Nutzung an. Um ein konkretes Business-Problem zu lösen, muss aber zunächst aus der Fülle der verfügbaren Methoden die richtige Verarbeitungsstrecke herausgesucht werden. Dafür mangelt es noch an den nötigen Experten, die ausreichend Erfahrung mit den verfügbaren KI-Techniken haben«, merkt Burkamp an. Selbst wenn die richtigen Methoden ausgewählt seien, stehe man vor der großen Herausforderung, dem KI-System ausreichend qualifizierte Daten für den Lernprozess zur Verfügung zu stellen. Mit ein paar tausend Datensätzen kommt man da nicht sehr weit und die Systeme bleiben bei hohen Fehlerquoten hängen. Die erforderliche Menge an Daten steht oftmals schlicht nicht zur Verfügung oder die Aufbereitung ist zu teuer, so dass der Nutzen nicht im Verhältnis zu den Kosten steht.

About the Author: Annette Stadler

Annette Stadler ist IT-Journalistin und leitet das Online-Portal ECMGUIDE.