STRATEGIE21. Januar 2025

Bildqualität entscheidet: Warum Dunkelverarbeitung schon am Eingang scheitert

Dunkelverarbeitung
Scanbot SDK

Stockende Dunkelverarbeitung hat oft eine einfache Ursache: Mangelhafte Dokumentenqualität am Erfassungspunkt. Während Versicherer viel Geld in komplexe Process Mining Tools und RPA-Systeme investieren, scheitert die Automatisierung oft schon an unscharfen Scans und falsch ausgerichteten Dokumenten.

von Eduard Frank, CTO von Scanbot SDK

Versicherer verarbeiten in der Regel zwei Arten von Dokumenten. Die erste Art sind strukturierte digitale Dokumente. Dazu gehören Online-Formulare und maschinenlesbare PDFs. Bei diesen Dokumenten ist jedes Datenelement bereits einem bestimmten Feld zugeordnet. Die zweite Art sind unstrukturierte Dokumente, beispielsweise gescannte Arztrezepte oder fotografierte Quittungen. Bei diesen Dokumenten muss der Text erst digitalisiert und die relevanten Daten dann den richtigen Feldern zugeordnet werden.

Während strukturierte Dokumente direkt in die Dunkelverarbeitung einfließen, stellen unstrukturierte Dokumentenscans eine technische Herausforderung dar. Für eine zuverlässige Texterkennung benötigen OCR-Engines Dokumente mit ausreichender Bildqualität und gutem Kontrast. Genau hier liegt das Problem: Bei der Fehlersuche konzentrieren sich IT-Teams aber häufig auf ihre OCR-Systeme und nachgelagerte Abläufe, während das eigentliche Verbesserungspotential am Anfang der Verarbeitungskette liegt.

Qualitätsanforderungen an eingehende Dokumente

Autor Eduard Frank, CTO Scanbot SDK
Eduard Frank hat eine Ausbildung zum Fachinformatiker in Bonn absolviert. Seit 2018 ist er CTO bei Scanbot SDK (Website), wo er 2016 als Technical Team Lead begann. Zuvor war er von 2015 bis 2016 als Senior Software Developer bei der ProUnix GmbH tätig. In seiner vorherigen Rolle bei der ip.labs GmbH (2004-2015), einem von Frank Thelen gegründeten Startup, arbeitete er in verschiedenen technischen Führungspositionen, angefangen als Senior Software Developer bis hin zum Chief Software Architect. Seine Karriere begann als Java- und Webentwickler bei Kabel New Media AG (2000-2001) und als Software Entwickler bei em|Motion GmbH (2001-2004).
Die automatische Verarbeitung stellt klare technische Anforderungen an die Dokumentenqualität: ausreichende Schärfe für die OCR-Erkennung, gleichmäßige Ausleuchtung für die Kontrastanalyse und korrekte Ausrichtung für die Formaterkennung. In gängigen Self-Service-Abläufen ist eine entsprechende Qualität aber nicht garantiert.

Ob Arztrechnungen, Rezepte oder Quittungen – Versicherte laden heute ihre Belege meist direkt über Versicherungs-Apps oder Webportale hoch. Das Smartphone ist dabei das häufigste Erfassungswerkzeug, doch ohne technische Unterstützung erstellen Nutzer oft qualitativ unzureichende Aufnahmen. Sie fotografieren Dokumente bei schlechter Beleuchtung, aus ungünstigen Winkeln oder mit verschmutzter Kameralinse.

Machine Learning in der Qualitätssicherung

Die Lösung liegt in der Integration intelligenter Bildverarbeitung direkt am Erfassungspunkt, kombiniert mit aktiver Nutzerführung. Moderne ML-Modelle erfassen etwa Dokumentränder in Echtzeit, korrigieren Belichtungsprobleme automatisch und gleichen Verzerrungen aus. Gleichzeitig erhält der Nutzer klare visuelle Hinweise:

So zeigt ein Rahmen die optimale Dokumentenposition an, und bei zu dunklen, verzerrten oder verschwommenen Aufnahmen erscheinen Warnmeldungen.”

Erst dann, wenn alle Qualitätskriterien erfüllt sind, wird die Aufnahme freigegeben. Dieses sofortige Feedback führt Versicherte intuitiv durch den Scanprozess – ohne technische Kenntnisse vorauszusetzen. Die kontinuierliche Qualitätsprüfung schon während der Aufnahme stellt hohe Scan-Qualität sicher, was zu präziseren OCR-Ergebnissen führt und damit die Erfolgsquote der nachgelagerten automatischen Verarbeitung deutlich erhöht.

Neben der Qualität ist bei der Verarbeitung sensibler Versicherungsdaten aber auch die Sicherheit entscheidend.

Datensicherheit durch lokale Verarbeitung

Die seit 2025 geltende DORA-Verordnung verschärft die EU-Sicherheitsstandards für Versicherer und fordert unter anderem strenge End-to-End-Verschlüsselung und minimale Zwischenspeicherung bei der Verarbeitung sensibler Versicherungsdaten.

Diese regulatorischen Anforderungen lassen sich elegant lösen, wenn der gesamte Scan- und Optimierungsprozess direkt auf dem Endgerät stattfindet, ohne Umwege über Drittserver.”

Die rein lokale Vorverarbeitung minimiert die potenziellen Angriffsvektoren: Sensible Dokumente verlassen das Gerät erst nach der Optimierung und in verschlüsselter Form. Neben erhöhter Sicherheit und Eingangsqualität führt dieser Ansatz auch zu geringerer Netzwerklast, da nur die bereits optimierten Dokumente übertragen werden.

Integration in bestehende Systeme

Die Integration von ML-gestützter Qualitätssicherung erfordert dabei keine Änderung bestehender Backend-Prozesse. Sie agiert einfach als vorgelagerter Qualitätsfilter. Die entsprechende Bildverarbeitung lässt sich sowohl in Versicherungs-Apps als auch in Webportalen implementieren. Entwickler können sie direkt als Kamera-Interface einbinden, etwa als eigener Dokumentenscanner, oder als Optimierungsschritt nach dem Upload nutzen.

Durch letzteres können auch bestehende Fotos automatisch verbessert werden.”

Aus Sicht der Backend-Systeme ändert sich dabei nichts – die eingehenden Dokumente erfüllen nun schlicht die Qualitätsanforderungen. Diese entkoppelte Architektur ermöglicht zudem eine schrittweise Einführung ohne Risiko für etablierte Workflows.

Fazit: Qualität von Anfang an sichern

Erfolgreiche Dunkelverarbeitung beginnt nicht erst im Backend, sondern schon am Punkt der Datenerfassung. Die Integration von ML-gestützter Qualitätssicherung direkt bei der Dokumentenaufnahme eliminiert die häufigsten Fehlerquellen noch vor der Backend-Verarbeitung.

Für IT-Entscheider bedeutet dies: Durch Analyse und Verbesserung der Dokumentenerfassung können sie Qualitätsprobleme an der Wurzel packen – und so die Dunkelverarbeitung optimieren, ohne in bestehende Backend-Prozesse einzugreifen.Eduard Frank, Scanbot SDK

Schreiben Sie einen Kommentar

Ihre E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert