»Sustain.AI« – Das KI-Tool zur Analyse von Nachhaltigkeitsberichten

Mehr Transparenz und schnellere Erfassung von wichtigen Indikatoren: Sustain.AI befähigt Wirtschaftsprüfer*innen und Controlling-Abteilungen, Nachhaltigkeitsberichte in kurzer Zeit strukturiert zu erfassen und zentrale Kriterien zuverlässig zu bewerten.

Wo bietet die KI-Anwendung den größten Nutzen?

Nachhaltigkeitsberichte sind ein wichtiger Bestandteil der Informationspolitik von Unternehmen. Sie geben einer interessierten Öffentlichkeit Auskunft über Aktivitäten und Leistungen der Organisation im Hinblick auf die nachhaltige Entwicklung. Seit 2017 müssen alle börsennotierten Unternehmen ab einer Größe von 500 Mitarbeitenden solche Berichte publizieren. Dabei orientieren sie sich an der sogenannten CSR-Richtlinie (Corporate Social Responsibility steht für gesellschaftliche Unternehmensverantwortung). Ziel dieser Richtlinie ist es insbesondere, die Transparenz über ökologische und soziale Aspekte von Unternehmen in der EU zu erhöhen. Dabei geht es um Informationen zu Umwelt-, Sozial- und Arbeitnehmer*innenbelangen sowie um die Achtung der Menschenrechte und die Bekämpfung von Korruption.

Nachhaltigkeitsberichte werden zudem, ähnlich wie Geschäftsberichte, als Grundlage für wichtige Kauf- oder Investitionsentscheidungen herangezogen. Die dazu nötige Identifizierung aller relevanten Kriterien und Informationen ist jedoch meist mit einem hohen Arbeits- und Zeitaufwand verbunden. Mit der von der EU umgesetzten Verschärfung der CSR-Richtlinie im Jahr 2023, die Berichtsvorgaben auf weitere Aspekte sowie einen größeren Kreis an Unternehmen ausweitet, wird diese Arbeit noch komplexer – insbesondere dann, wenn Berichte manuell ausgewertet werden.

Mit dem KI-basierten Tool Sustain.AI wird diese Arbeit erleichtert. Mithilfe der maschinellen Texterkennung können Nachhaltigkeitsberichte jetzt sehr effizient und strukturiert analysiert werden. Die Technologie hinter Sustain.AI richtet sich insbesondere an Wirtschaftsprüfer*innen und Controller*innen, die das Tool in ihrem Arbeitsalltag nutzen können.

Was sind die Qualitätsmerkmale von »Sustain.AI«?

  • Zeitersparnis: Der KI.NRW-Demonstrator ermöglicht einen schnellen und effizienten Umgang mit Nachhaltigkeitsberichten und der Analyse der zu erfüllenden CSR-Kriterien. Mithilfe von KI-Sprachmodellen werden die relevanten Textpassagen zu den jeweiligen Kriterien herausgefiltert. Prüfer*innen können somit ihren Fokus auf diejenigen Abschnitte richten, die für das jeweilige Kriterium die höchste Relevanz haben.
  • Übersicht und Kontext: Der integrierte PDF-Viewer bietet die Möglichkeit, sich jederzeit die extrahierten Textelemente im Bericht anzeigen zu lassen. So können Benutzer*innen den Kontext der Passage auf einen Blick erfassen.  
  • Integriertes Feedback und Anpassungsfähigkeit: Durch das eingebaute Feedbacksystem können Benutzer*innen die Vorschläge des Systems bewerten. Damit können wir das KI-Modell weiter trainieren und die Qualität stetig verbessern. Es ist auch in der Lage, neue Kriterien zu erlernen.
»Nachhaltigkeit rückt immer stärker in den öffentlichen Fokus. Mit dem KI-gestützten Tool Sustain.AI ist es möglich, Nachhaltigkeitsberichte effizient zu analysieren und zu durchsuchen.«
Maren Pielka
Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS

Welche KI-Technologie steckt im KI.NRW-Demonstrator?

Sprachmodelle

Bei modernen Sprachmodellen handelt es sich um Neuronale Netze, die darauf trainiert werden, ein Wort dadurch vorherzusagen, in welchem Kontext es steht. So lernt es eine wirksame Repräsentation für alle Wörter des Textes und ist in der Lage, Textpassagen semantisch zu vergleichen und einzuordnen.

Bilderkennung

PDF ist ein weit verbreitetes unstrukturiertes Dateiformat. Das heißt, obwohl Überschriften und Tabellen für Leser*innen visuell erkennbar sind, ist intern keine Struktur vorhanden. Um maschinell mit PDFs arbeiten zu können, bedarf es intelligenter Bildverarbeitungsalgorithmen, die diese Struktur aus den Bildern extrahieren und Objekte wie zum Beispiel Tabellen und Paragrafen richtig klassifizieren.

Was zeigt der KI-Demonstrator?

Bei dem KI-gestützten Vorschlagssystem handelt es sich um eine intelligente, intuitive Suchmaschine. Man kann sowohl eigene Dokumente hochladen als auch vorhandene Berichte anschauen. Die Berichte sind anhand einer hinterlegten Checkliste der »Global Reporting Initiative« – ein weit verbreitetes Reporting-Rahmenwerk zur Nachhaltigkeitsberichterstattung – durchsuch- und analysierbar.

Jetzt unverbindliches Gespräch mit unseren Expert*innen anfragen!

Neugierig geworden? Hier geht es zum Demonstrator!

Wo sind weitere Informationen zu finden?

KI.Landkarte mit Einträgen im Bereich Datenanalyse und Prognose

KI-Anbieter, Anwendungen und KI-Produkte »made in NRW« mit dem gleichen KI-Schwerpunkt finden Sie über die Filter- und Suchfunktion der KI.Landkarte, die aktuell mehr als 1000 Einträge umfasst.

Studie »Moderne Sprachtechnologien«

Erfahren Sie, an welchen Stellen moderne Sprachtechnologien uns im Alltag und Beruf begegnen und welche wirtschaftlichen Möglichkeiten damit verbunden sind.

Fraunhofer IAIS: Media Engineering

Mehr über die Themenfelder »Cognitive Business Optimization«, »Smart Coding and Learning« sowie KI-basierte industrielle Bildverarbeitung lernen Sie auf der Internetseite der IAIS-Institutsabteilung Media Engineering kennen.

Kontakt zum Team der Entwickler*innen

Maren Pielka

Data Scientist und Teamleiterin Cognitive Text Analytics,
Geschäftsfeld Cognitive Business Optimization,
Abteilung Media Engineering

Fraunhofer IAIS
Schloss Birlinghoven
53757 Sankt Augustin

Telefon +49 2241 14-2871

E-Mail senden

Lars Patrick Hillebrand

Doktorand / Wissenschaftlicher Mitarbeiter in Machine Learning
Abteilung Media Engineering

Fraunhofer IAIS
Schloss Birlinghoven
53757 Sankt Augustin

Telefon +49 2241 14-1920

E-Mail senden

Bilderkennung und -verstehen

Intelligente Dokumentenanalyse »recognAIze«

Mit der intelligenten Dokumentenanalyse von recognAIze können Daten aus Dokumenten erkannt und automatisiert ausgewertet werden.

Wo bietet die KI‐Anwendung den größten Nutzen?

Die manuelle Sichtung von Belegen, Rechnungen und anderen Dokumenten, ihre digitale Erfassung und Bereitstellung ist in vielen Unternehmen sowie Verwaltungsinstitutionen mit einem hohen Zeit- und Kostenaufwand verbunden. Die Lösung liefern intelligente Dokumentenanalysesysteme auf Basis von Optischer Zeichenerkennung (OCR), die wie »recognAIze« eine schnelle, einfache und automatisierte Analyse sowie eine Blindverarbeitung aller Arten von Dokumenten ermöglichen. Die Unterlagen werden dank Künstlicher Intelligenz automatisch erfasst, ausgelesen, zugeordnet und weiterverarbeitet. Beschädigte Originale, qualitativ minderwertige Scans von Dokumenten sowie insbesondere auch vertrauliche Unterlagen werden ohne weiteres Zutun des Menschen und nach hohen Datenschutzstandards verarbeitet.

Was sind die Qualitätsmerkmale bei solchen KI‐Anwendungen?

  • Die Grundlage der Dokumentenanalyse bilden die zu analysierenden Inputdaten. Da die Dokumente meist in schwankender Bildqualität erfasst werden, ist eine automatisierte Bildverbesserung in der KI-Anwendung sehr wichtig.
  • Die KI-basierte optische Zeichenerkennung (OCR) mittels Künstlicher Neuronaler Netze sorgt dafür, dass nicht nur einzelne Textzeichen erkannt und verarbeitet werden, sondern auch Textpassagen und die Struktur eines Dokumentes (z.B. Kopf- oder Fußzeilen).
  • Durch eine Layout-Analyse kann die KI-Anwendung auch Tabellen in einem Dokument identifizieren und die Inhalte interpretieren, um beispielsweise Rechnungen automatisiert in der Buchhaltung zu verarbeiten.
  • Insbesondere bei sensiblen Informationen müssen die angewandten KI-Verfahren sicher sein und alle Daten DSGVO-konform auf deutschen Servern oder On-Premise beim Kunden verarbeitet werden.
  • Künftig wird in den Anwendungen auch die Handschrifterkennung (ICR) eine Rolle spielen, um zusätzliche Anwendungsfelder zu erschließen und eine vollständige Überführung von Inhalten zu erreichen.

Welche KI‐Technologie steckt im KI.NRW‐Demonstrator?

Deep Learning‐OCR

Die optische Zeichenerkennung (Optical Character Recognition OCR) kombiniert mit Convolutional Neural Networks (CNN) und Long Short-Term Memory (LSTM) zwei aktuelle Ansätze im Bereich der Künstlichen Intelligenz, um aus Pixeln Zeichen zu entwickeln. Sie entnimmt den Bildern ihre Texte und generiert für jedes Dokument eine strukturierte XML Datei mit Positionsdaten der erkannten Wörter und Seitenbereiche.

Bildverbesserung

Für bestmögliche Qualität der Ergebnisse müssen negative Einflussfaktoren wie eine mangelnde Belichtung des gescannten Dokuments oder eine Wölbung bzw. Verzerrung im Bild ausgeglichen werden. Die eingesetzten Algorithmen zur Bildverbesserung führen dafür eine Umwandlung in Graustufen und eine Binarisierung durch. Außerdem werden Verfahren zur Entfernung von Wölbungen und anderen Störfaktoren genutzt.

Layouterkennung

Die Layouterkennung erkennt die Struktur von Text und hilft dabei, die erkannten Zeichen in Spalten, Textabschnitte oder Überschriften einzuteilen und eine Lesereihenfolge zu bestimmen. So können auch Tabellenstrukturen erkannt und als solche wieder ausgegeben werden, z.B. in einem csv-Format. Das Ausgabeformat wird mit entsprechenden Metadaten versehen.

»Durch die genutzten Methoden zur Bildverbesserung, Layout-
und Zeichenerkennung können selbst Dokumente in schlechter
Qualität ausgewertet werden.«
Dr. Nicolas Flores-Herr
Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS

Was zeigt der KI.NRW‐Demonstrator?

Der KI.NRW-Demonstrator »recognAIze« macht eine KI-gestützte Dokumentenanalyse erlebbar. Über die Anwendung können Ihre eigenen abfotografierten oder eingescannten Dokumente in das System hochgeladen werden und stehen dort zum Testen der intelligenten Dokumentenanalyse zur Verfügung. Die Animationen führen Schritt für Schritt durch die im Demonstrator genutzten KI-Technologien.

Dokumente optimieren

Häufig besitzen abfotografierte oder eingescannte Dokumente eine schwankende Bildqualität, sind teilweise verwellt, zerrissen oder verschmutzt. Bildverbesserungsverfahren sorgen dafür, dass selbst alte oder beschädigte Schriftstücke verarbeitet werden können. Der Demonstrator »recognAIze« führt anschaulich durch die Bandbreite der Optimierungsmöglichkeiten, die für eine hochwertige Dokumentenanalyse unverzichtbar sind.

Zeichen und Strukturen erkennen

Die Treffsicherheit und Geschwindigkeit der OCR-Engine zur intelligenten Zeichenerkennung von »recognAIze« ist höher als die führender Marktteilnehmer. Ohne Templates und händische Nachbereitung erkennt der Demonstrator die Layouts der Dokumente, z.B. Absenderinformationen oder Datumsangaben. Selbst komplexe Textinhalte wie Text-um-Bild-Elemente werden durch die Anwendung sicher erkannt.

Tabellen verstehen

Eine besondere Herausforderung bilden Tabellen, da sie von Dokument zu Dokument unterschiedlich aufgebaut sein können. KI-Methoden sind dafür verantwortlich, dass Tabelleninhalte nach Informationsarten unterteilt und die Segmente einzeln interpretiert werden können.

Inhalte klassifizieren

Der Demonstrator »recognAIze« ermittelt die Eigenschaften des Dokumentes, bewertet die einzelnen Elemente und ermöglicht dadurch eine ganze Reihe von anschließenden Weiterverarbeitungen. Durch die intelligente Klassifikation wird beispielweise die Blindverarbeitung von vertraulichen Dokumenten überhaupt erst möglich. Das bedeutet, dass Informationen aggregiert oder pseudonymisiert genutzt werden können, ohne dass ein Mensch Einsicht in die Dokumente erhält. Auf diese Weise können sensible, personenbezogene Daten besser geschützt werden.

Schnittstellen bilden

Die KI-gestützte Dokumentenanalyse steht häufig am Anfang einer Prozesskette, ob nun in der Buchhaltung oder in Archiven. Damit die weiteren Verarbeitungsschritte anschließen können, bietet der KI.NRW Demonstrator verschiedene Ausgabeformate wie XML oder PDF.

Neugierig geworden?
Hier geht es zum Demonstrator!

Wo sind weitere Informationen zu finden?

Studie »Moderne Sprachtechnologien«

Erfahren Sie, an welchen Stellen moderne Sprachtechnologien uns im Alltag und Beruf begegnen und welche wirtschaftlichen Möglichkeiten damit verbunden sind.

KI-Produkte »Made in NRW«

Filtern Sie unsere KI-Landkarte nach dem Schwerpunkt »Sprach- und Textverstehen«:

KI-Anbieter aus NRW

Unsere KI-Landkarte zeigt Ihnen, wer KI-Methoden rund um das Sprach- und Textverstehen in seinem Portfolio hat.

Kontakt rund um den Demonstrator

Dr. Nicolas Flores-Herr

Geschäftsfeldleiter Document Analytics

Fraunhofer IAIS
Schloss Birlinghoven
53757 Sankt Augustin

Telefon +49 2241 142532

Email schreiben

Dr. Iuliu Konya

Senior Research Engineer

Fraunhofer IAIS
Schloss Birlinghoven
53757 Sankt Augustin

Telefon +49 2241 142543

Email schreiben

 

Marius Nißlmüller

Studentische Hilfskraft Unternehmensentwicklung

Fraunhofer IAIS
Schloss Birlinghoven
53757 Sankt Augustin

Email schreiben

Zum Seitenanfang