OCR, AI und der Kampf gegen manuelle Dateneingabe.

Interview mit Petr Baudis von Rossum.ai

Rechnungen, Rechnungen, Rechnungen. Nicht nur, dass sie bezahlt werden müssen, sie sollen auch alle richtig eingetragen und gespeichert werden. Sogar mit einem ausgeklügelten ERP-System kommt man um die manuelle Dateneingabe nicht herum. Selbst wenn ein Unternehmen "nur" 30 Rechnungen pro Monat bekommt, sind es schon mehrere Stunden Arbeit, die Mitarbeiter erledigen müssen, nur um Rechnungen korrekt in das System einzutragen. Datenpol entschied sich, eine Lösung dazu zu finden und entwickelte zusammen mit der Firma Rossum das Odoo OCR Modul  für die automatisierte Erfassung von Eingangsrechnungen. 

Das Modul kombiniert künstliche Intelligenz, Machine Learning und Optical Character Recognition (OCR) um automatisch den Inhalt von einkommenden Rechnungen zu erkennen und in das ERP-System einzutragen. Genau wie bei Odoo steht auch hier die Flexibilität und Anpassungsfähigkeit im Vordergrund. Mit jeder Rechnung lernt das System dazu und wird schneller und präziser in der Datenerfassung.

Die Technologie, die hinter dem ganzen steht hat unglaubliches Potenzial, daher haben wir Petr Baudis, den Gründer und Technischen Leiter von Rossum eingeladen, ein Paar Fragen zu dem Thema zu beantworten und über die Zukunft von OCR zu erzählen.

datenpol: Wie ist Rossum entstanden? Was war die ursprüngliche Vision der Firma und hat sich diese im Laufe der Zeit verändert?

Baudis: Wir haben Rossum als unser zweites Startup gegründet als wir gesehen haben, wie viel Zeit und Mühe dabei verschwendet wird, Daten aus Geschäftsdokumenten in Software zu übertragen. Das Ziel, eine Welt ohne manuelle Dateneingabe zu ermöglichen war damals unser Ziel und bleibt es bis heute noch. Mit der Zeit haben wir ein viel tieferen Einblick in die Geschäftsprozesse rund um Dateneingabe bekommen und auch die vielfältige Integrationslandschaft besser kennengelernt.

Das lässt uns immer mehr darüber nachdenken, wie wir langfristig zu einer Firmenweiten Schnittstelle für eingehende Dokumente werden können. Aber unser Kernziel bleibt es, mühevolle Dateneingabe mithilfe künstlicher Intelligenz zu einem Ding der Vergangenheit zu machen. 


Odoo • Image and Text

Obwohl die Technologie, die hinter dem Modul steckt, äußerst komplex ist, ist es sehr einfach in der Bedienung. Unser CTO, Andreas Brückl, hat eine ausführliche Erklärung dazu verfasst, doch hier nochmal ein kurzer Überblick für alle Quereinsteiger.

Der Prozess besteht aus drei Schritten:

  1. Die Rechnungen werden in digitaler Form (als PDF oder eingescannt) an eine vordefinierte Email-Adresse geschickt und automatisch vom OCR Modul ausgewertet. 

  2. Ein Mitarbeiter validiert den Eintrag um sicherzustellen, dass die Daten korrekt sind. Dateneingabe ist nicht notwendig, höchstens Korrekturen in wenigen Fällen.

  3. Die validierten Daten werden automatisch in Odoo als Rechnung angelegt. 

Das System erinnert sich an die Korrekturen und passt sich so im Laufe der Zeit an die Rechnungsformate immer mehr an. Somit läuft das System mit jeder Rechnung effektiver und schneller.


datenpol: Was sind deiner Meinung nach die wichtigsten Anwendungsbereiche für die Technologie? Gibt es Use-Cases, die nicht so viel Aufmerksamkeit bekommen, wie sie sollten?

Baudis: Ohne Zweifel ist die Kernkompetenz der Technologie die Erfassung von Eingangsrechnungen. Aber eine der großen technischen Fortschritte von Rossum ist eben die Anpassbarkeit. Wir sehen aktuell große Erfolge in Use-Cases wo unserer Technologie stark adaptiert und angepasst wurde, um verschiedenste Geschäftsunterlagen auszulesen. Generell kann ich sagen, dass in allen Situationen wo manuelle Eingabe möglich ist, unsere KI-Engine mit einer sehr hohen Erfolgsquote darauf trainiert werden kann.

OCR existiert als Technologie seit den 1930er Jahren , wurde aber zum Großteil als eigenständige Technologie betrachtet und fand viel Anwendung bei der Auslesung von Texten für sehbehinderte Menschen. Firmen wie Rossum nutzen nun die Möglichkeit eines SaaS-Geschäftsmodells um die Technologie nicht nur zu verbessern, sondern auch als Teil von größeren Systemen wie Odoo zu integrieren. Somit können verschiedene Systeme von OCR profitieren, ohne dabei eigene Kompetenzen in dem Bereich aufbauen zu müssen.

datenpol: Was für Vorteile können Benutzer erwarten, die noch keine Erfahrung mit OCR haben?

Baudis: Wenn es um komplexe und vielfältige Dokumente geht, kann man sich vor allem eine große Zeitersparnis erwarten. Eine gute Schätzung wäre, dass Mitarbeiter grundsätzlich sechs bis zehn Mal schneller bei der Datenaufnahme sind im vergleich zur manuellen Eingabe. Klarerweise spiegelt sich das alleine in einer massiven Kapazitätssteigerung und Kostenersparnis wieder. Trotzdem beinhaltet dieser Prozess die Validierung der verarbeiteten Dokumente durch Mitarbeiter - nur kann das effektiv und meistens ohne Korrekturen durchgeführt werden. Ich halte mich davor zurück, volle Automatisierung ohne menschlichem Zutun zu versprechen. Um Fehlerraten niedrig zu halten wäre das ein sehr langfristiges Ziel.

datenpol: Lässt sich die Leistung des Systems irgendwie in Zahlen fassen?

Baudis: Die Use-Cases sind in unserem Fall so unterschiedlich, dass es wirklich schwer ist, hier Zahlen zu nennen die auf alle zutreffen. Wir sehen immer wieder, dass Arbeitsaufwand sich um sechs bis zehn Mal verkürzt, wie vorher gesagt. Ich glaube das beschreibt die Effizienz unserer Lösung sehr gut. Bei Rossum ist uns der Mehrwert unserer Lösung für unsere Kunden extrem wichtig, daher haben wir uns in einer Artikelserie mit den Eigentumsgesamtkosten einer OCR-Lösung auseinandergesetzt und diese genau analysiert.

Jedes Jahr gibt es neue Technologien, die zum Trend werden. Es wird viel darüber diskutiert und berichtet, und man bekommt leicht den Eindruck, dass jedes Unternehmen ab nun diese oder jene Lösung einsetzen muss. Vor allem für Unternehmen, die sich zum ersten Mal mit dem Thema ERP auseinandersetzen, kann das überwältigend sein. Doch was zählt, ist der Wert unter dem Strich. Jede Lösung, die implementiert wird, sollte einen Use-Case haben und ein Bedürfnis lösen. Ein Unternehmen mit Hunderten an Eingangsrechnungen wird zweifelsohne durch eine OCR-Lösung profitieren. Für ein Unternehmen, wo die manuelle Eingabe der Rechnungen nur wenige Stunden im Monat in Anspruch nimmt, wird die Lösung keine signifikanten Vorteile bringen.

datenpol: Welche neuen Anwendungsbereiche für OCR siehst du in der Zukunft? In welche Richtung soll Rossum in den nächsten Jahren gehen?

Baudis: Allgemein wird OCR Technologie, und natürlich auch Rossum, viel leichter anpassbar werden an verschiedene Dokumente. Dadurch werden sich auch viele neue Einsatzmöglichkeiten eröffnen.

Übrigens liegen mir die pro-bono Aktivitäten von Rossum besonders am Herzen. Dokumente sind nicht nur im Backoffice von Unternehmen zu finden. Staatsarchive sind nichts anderes als riesige Lager voller Dokumente. Öffentliche Dokumente zu digitalisieren und diese auch suchbar zu machen kann nicht nur zur politischen transparenz beitragen, sondern auch zum wissenschaftlichen Fortschritt. Wir arbeiten schon jetzt an mehreren Projekten in dem Bereich und sind ständig auf der Suche nach neuen Herausforderungen.

Odoo • Image and Text

Petr Baudis

Petr Baudis ist Chief AI Architect bei Rossum und einer der ursprünglihcen Authoren von Git. Abgesehen von seiner Arbeit bei Rossum hat er eines der besten KIs für das Brettspiel Go entwickelt und seine Algorithmen für Textanalyse machen den Neural Networks von Facebook Konkurrenz.

Rosenbauer Logo
Mammut Logo
OEBB Logo
Cell Logo
TZ Austria Logo

Sie wollen digital und sicher arbeiten?

Lassen Sie uns Ihnen helfen, wir beraten Sie gerne.