Definition Was ist Intelligent Document Processing?

Von zeroshope 2 min Lesedauer

Anbieter zum Thema

Intelligent Document Processing ist die Bezeichnung für eine KI-gestützte Extraktion von Daten aus Dokumenten wie Geschäftsbriefen, E-Mails oder Bildern. Der mühsame, aber wichtige Prozess funktioniert dadurch automatisch und nicht mehr manuell.

Grundlagenwissen zum IT-Business(Bild:  © adiruch na chiangmai - Fotolia.com)
Grundlagenwissen zum IT-Business
(Bild: © adiruch na chiangmai - Fotolia.com)

Daten sind insbesondere für Unternehmen eine der wertvollsten Ressourcen überhaupt. Oft können diese wertvollen Informationen allerdings nicht nutzbar gemacht werden. Sie sind als Rohdaten in Dokumenten versteckt und können daher nicht ausgewertet werden. Als Beispiele seien Informationen aus Geschäftsbriefen oder E-Mails genannt. Eine Extraktion bedurfte lange einer umfangreichen manuellen Arbeit. Das Intelligent Document Processing (IDP) bzw. die intelligente Dokumentenverarbeitung automatisiert diesen mühsamen Vorgang. Hierfür kommen KI-gestützte Anwendungen zum Einsatz.

Diese KI-Technologien sind Teil des Intelligent Document Processings:

  • NLP bzw. Verarbeitung natürlicher Sprache: Die Lösungen können Daten von sonstigen Inhalten in Briefen und Mails unterscheiden.
  • ML bzw. maschinelles Lernen: Die Lösungen sind durch zahlreiche Beispiele darauf trainiert, die richtigen Daten zu erfassen und zu verarbeiten. Oft befinden sich auch unnötige oder geschützte Daten in den Dokumenten - beispielsweise das Alter von Kindern der Person, die das Schreiben verfasst hat. Durch maschinelles Lernen weiß das System, was relevant ist und was nicht.
  • DL bzw. Deep Learning: Hierbei handelt es sich um eine Sonderform des maschinellen Lernens, die besonders leistungsstark und „intelligent“ ist. Deep Learning ist deshalb für die Verarbeitung sehr großer Datenmengen ausgezeichnet geeignet.
  • Bilderkennung: Oft befinden sich relevante Informationen in Fotos oder sonstigen Bildern. IDP-Lösungen können diese erkennen und nutzbar machen.

Der Mensch ist nicht vollständig aus der Gleichung gestrichen, wird aber erst ganz am Ende benötigt.

Das Intelligent Document Processing benötigt nach wie vor menschliche Aufsicht, aber erst ganz am Ende. Der Prozess läuft folgendermaßen ab:

  • Analyse (oft auch Vorverarbeitung genannt)
  • Klassifizierung des Dokuments (Bild, Brief, etc.)
  • Extraktion der Daten
  • Validierung der Informationen mit Blick auf die Domäne (Wohin gehören die Informationen?)
  • Erweiterte Validierung (Was sagen die Informationen aus? Was ist auffällig mit Blick auf die Daten?)
  • Validierung durch den Menschen (Kontrolle der Arbeit, Zuordnung der Daten für weitere Arbeits- und Analyseprozesse)

IDP-Lösungen verbessern sich dabei fortwährend selbst. Dies bedeutet, sie lernen mit jedem Vorgang. Dies macht sie leistungsstärker. Ein diesbezüglich prominentes Beispiel ist das Rechnungswesen: Maschinen können Zahlungsvorgänge inzwischen autonom vornehmen, was verhindert, dass es zu verspäteten Begleichungen offener Posten kommt.

(ID:49857567)

Wissen, was läuft

Täglich die wichtigsten Infos aus dem ITK-Markt

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung