ARCHIV20. Juli 2020

Deep Learning An­wen­der­be­richt von aifinyo: Au­to­ma­ti­sie­rung der Datenextraktion aus Rechnungen

Unternehmer müssen oft lange auf die Bezahlung ihrer Rechnungen warten. Häufig wird die Zahlungsfrist überzogen und sie gehen teils Monate mit ihrer bereits erbrachten Leistung in Vorkasse. Factoring-Anbieter wie aifinyo finanzieren offene Rechnungen vor. Dabei verkaufen Unternehmen ihre Forderungen und erhalten dabei sofort das Geld direkt auf dem Firmenkonto, abzüglich einer Servicegebühr. Factoring ist aktuell wegen der Corona-Folgen und -Risiken ein wichtiges Thema. Die Zahlungsmoral von Unternehmen ist angesichts der Corona-Pandemie gesunken. Das macht die Liquiditätssicherung umso relevanter. Damit das funktioniert, muss eine KI ran. Der Anwenderbericht.

aifinyo
Factoring sichert fortlaufende Liquidität. Die Factoring-Umsätze in Deutschland stiegen 2019 um starke 13,9 Prozent auf nunmehr 275,5 Mrd. Euro. Ihm kommt zunehmende wirtschaftliche Bedeutung für immer mehr Branchen und Unternehmen jeder Größe zu. Aber es ist gar nicht so leicht, monatlich tausende Rechnungen korrekt zu erfassen.

Herausforderung beim Upload von Rechnungen

Pro Monat werden tausende Rechnungen über das Portal der aifinyo hochgeladen. Diese müssen korrekt ausgelesen werden, um weitere Verarbeitungsschritte wie zum Beispiel die Bonitätsprüfung eines Rechnungsstellers für aifinyo zu ermöglichen. Dabei müssen Rechnungssteller, Empfänger und deren jeweilige Adressen korrekt ausgelesen werden. Auch die Empfängerdaten wie IBAN und Steuernummer werden benötigt.

Insgesamt müssen ca. 40 Kategorien aus jeder Rechnung extrahiert werden.”

Die Nutzer der aifinyo-Plattform sollen davon nicht viel mitbekommen: Sie laden lediglich Ihre Rechnungen im Portal hoch und alle weiteren Prozessschritte werden intern abgewickelt. Das Auslesen von Rechnungen ist dabei ein wesentlicher Kostentreiber: Die manuelle Extraktion durch eigene Mitarbeiter ist kostenintensiv, fehleranfällig, dauert lange und ist schwer skalierbar.

Autor Prof. Dr.-Ing. Roland Fassauer, Vorstand IT und Digitalisierung aifinyo
Prof. Dr.-Ing. Fassauer war 1996, nach seinem Studium der angewandten Informatik an der Technischen Hochschule Leipzig, Mitbegründer des deutschen E-Commerce-Pioniers Intershop in Jena. Seit 2004 ist er Vorstandsmitglied des von ihm mitgegründeten Instituts für Angewandte Informatik (InfAl) an der Universität Leipzig mit heute über 100 Forschenden.

In den folgenden Jahren war er an der Gründung oder Finanzierung weiterer erfolgreicher Unternehmen beteiligt. Ende 2015 beteiligte er sich am Factoring-FinTech Decimo und übernahm die CIO-Rolle. Im Zuge der Integration der Decimo GmbH in die aifinyo (Website) übernimmt Prof. Dr.-Ing. Fassauer nun im gemeinsamen Unternehmen die Verantwortung für die Bereiche IT und Digitalisierung.

Es gibt bereits Software-Lösungen, die dieses Problem zu lösen versuchen. Dabei handelt es sich meist um traditionelle, Template-basierte OCR Systeme. Hier muss der Nutzer, in dem Fall aifinyo, vordefinierte Layouts festlegen. Man sagt dem System quasi, an welcher Stelle sich z. B. die Informationen des Rechnungsstellers oder der Rechnungsbetrag und der Umsatzsteuerbetrag befinden. Nachteil: Diese Systeme sind stark fehleranfällig, wenn eine Rechnung von der Regel abweicht. Da in der Wirtschaft praktisch jede Rechnung anders aussieht, benötigen diese Systeme einen hohen Einrichtungs- und Instandhaltungsaufwand. Dies war für aifinyo unzureichend.

Bei monatlich mehreren tausend Rechnungen von verschiedensten Kunden ist es unmöglich, das Rechnungslayout jedes Kunden in das OCR „einzupflegen“. Zudem kommen jeden Monat viele Neukunden dazu. Man müsste also extra Mitarbeiter beschäftigen, die permanent diese Layouts anlegen und updaten. Das Problem würde sich also nur verlagern.

Die Lösung: Künstliche Intelligenz

Um hier eine effiziente Lösung zu schaffen, entschied sich aifinyo für eine Kooperation mit der Berliner Markov Solutions. Diese hat sich auf die Automatisierung von dokumentenbezogenen Prozessen mithilfe Künstlicher Intelligenz (KI) spezialisiert und bietet eine passende Technologie. Der Hauptfokus liegt hierbei auf der Automatisierung von Datenextraktionsprozessen aus Dokumenten. Da Markov Solutions ursprünglich als Agentur für KI-getriebene Software Projekte gestartet wurde und sich dann auf dokumentenbezogene Prozesse spezialisiert hat, gab es bereits ein erfahrenes Team von KI-Entwicklern.

Extraktions-KI zieht Daten aus den verschiedensten Dokumenten

Die KI extrahiert und kategorisiert Daten aus gescannten, fotografierten oder digitalen Dokumenten. Das System wurde für aifinyo und deren Dokumententyp „Rechnung“ sowie für die gewünschten Kategorien zur Extraktion entwickelt und macht die Probleme mit herkömmlichen OCR-Systemen oder manuellen Verarbeitungsprozessen obsolet. Die KI läuft als API auf eigenen Servern von aifinyo und die KI gibt die extrahierten Daten zurück zur weiteren Verarbeitung.

Dabei versteht die Künstliche Intelligenz Dokumente ähnlich wie ein Mensch und kann deshalb mit jeder Art von Rechnungen umgehen, egal wie unterschiedlich diese aussehen.”

Dabei sind lästige Prozesse wie ein Template Setup überflüssig. Die Extraktion von Daten aus Rechnungen funktioniert damit schneller, zuverlässiger, deutlich kostengünstiger als bisher und ist zusätzlich noch skalierbar.

Was genau ist KI in dieser Lösung?

aifinyo AG
aifinyo Vorstand
aifinyo Vorstandaifinyo

aifinyo ist Anbieter einer Technologieplattform für Finanzen und Liquidität. Das Unternehmen liefert Lösungen für Gründer, Freiberufler und mittelständische Unternehmen in Form von Factoring, Finetrading, Leasing und Inkasso. Die Tochtergesellschaften aifinyo finance und aifinyo lease sind Finanzdienstleister der Bundesanstalt für Finanzdienstleistungsaufsicht (BaFin). Die Aktien der aifinyo AG sind seit Dezember 2018 im m:access, einem Marktsegment speziell für mittelständische Unternehmen innerhalb des Freiverkehrs der Börse München, gelistet.

Für die Entwicklung des Systems wurden neuronale Netzwerke (sog. Deep-Learning-Algorithmen) verwendet. Dabei konnten die KI-Spezialisten direkt wissenschaftliche Erkenntnisse in die Praxis umsetzen.

In der Praxis werden neuronale Netze jeweils auf die Bewältigung einer bestimmten Aufgabe trainiert. Im Falle der Datenextraktion muss das System, einfach ausgedrückt, für jedes Wort vorhersagen, ob es einer bestimmten Kategorie (z.B. Rechnungssteller-Straße) angehört oder nicht. Um an diesen Punkt zu gelangen, muss das System „trainiert“ werden. Dabei wird ein Datensatz aus verschiedensten Rechnungen erstellt, welcher dem System im Training als Referenz dient. Man zeigt der KI in der Entwicklung bzw. dem Training etwa 2000 Rechnungen und wie diese hätten extrahiert werden sollen.

Die KI lernt dadurch, wie Rechnungen inhaltlich und strukturell aufgebaut sind und wie die Aufgabe der Datenextraktion zu bewältigen ist. Nach der Trainingsphase ist die KI in der Lage, die gelernten Informationen auch auf komplett neue Rechnungen (die die KI noch nie zuvor gesehen hat) anzuwenden und daraus Daten/Kategorien zu extrahieren. KI bestimmt also, welche Wörter/Zeichen auf einer Rechnung welcher Kategorie angehören. Automatisierte Skripte erfassen darauf basierend im Anschluss die gewünschten Daten.

Die KI lernt demnach anhand von Referenz-Rechnungen, wie einzelne Rechnungen aufgebaut sein können und wie die Aufgabe der Datenextraktion zu bewältigen ist, um danach mit diesem Wissen auf neue, vorher unbekannte Rechnungen zu generalisieren.

Die Vorteile einer KI-basierten Softwarelösung

  • bis zu 90% Zeitersparnis im Prozess
  • deutlich geringere Fehlerquote
  • KI kann mit allen Dokumenten arbeiten, egal wie unterschiedlich diese aussehen
  • kundespezifische Kategorien zur Extraktion
  • KI wird kontinuierlich verbessert
  • auf die Datenextraktions-KI können andere Funktionen aufbauen:
    Ist das Dokument valide?

Wurden alle notwendigen Angaben gemacht?

Abgleich mit anderen Informationsquellen: Schreibt jemand bspw. eine zu hohe Rechnung?

  • Skalierbarkeit
  • 8-mal schnellere Datenerfassung als die manuelle Dateneingabe und Reduktion der Tastenanschläge um 97%
Prof. Dr,-Ing Roland Fassauer, Vorstand IT und Digitalisierung aifinyo<q>aifinyo
Prof. Dr,-Ing Roland Fassauer, Vorstand IT und Digitalisierung aifinyoaifinyo

Fragen an Prof. Dr,-Ing Roland Fassauer, Vorstand IT und Digitalisierung aifinyo

Wie werden Fehler in der strukturellen Erkennung vermieden?

Da nicht jede Rechnung den Rechnungsbetrag an der gleichen Stelle ausweist, müssen alle, auch „unkonventionelle“ Rechnungen erfasst werden.”

Unsere KI liest und versteht die Rechnungen ähnlich wie ein Mensch. Deshalb spielt es keine Rolle, ob der Rechnungsbetrag oben, unten oder auf der linken Seite steht.

Wie rekrutieren sich die Ausgangsdatensätze für die KI?

Der Datensatz wird möglichst diversifiziert erstellt – d.h. die Rechnungen sollten möglichst unterschiedlich aussehen und viele Szenarien abdecken – so lernt die KI am besten.

Hat das Language-Modell Grenzen? Erkennt es zum Beispiel anhand der Worte, ob es sich um eine Rechnung oder ein Anschreiben handelt?

Freie Formulierungen liest und bearbeitet die KI ebenfalls problemlos.

Schreiben Sie einen Kommentar

Ihre E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert