Bilderkennung und -verstehen

KI-basierte Diagnoseunterstützung in der Medizin mit »Pneumo.AI«

Vorteile

Ausgaben- & Einnahmenoptimierung
Echtzeitergebnisse 24/7
Energieeffizienz
Entlastung / Komfort
Kreativität & Innovation
Materialeffizienz
Präzision / Qualität
Prozessoptimierung
Wissen & Komplexitätsreduktion
Zeiteffizienz & Agilität

Funktionsbereiche

Prozessoptimierung

Zum demonstrator

→ Zum interaktiven KI-Spiel »Pneumo.AI«

Zur Übersicht

KI-basierte Diagnoseunterstützung in der Medizin mit »Pneumo.AI«

»Pneumo.AI« ist eine KI-gestützte Diagnosesoftware, die medizinisches Fachpersonal mittels intelligenter Bilderkennung bei der eindeutigen Identifikation von Lungenentzündungen (Pneumonie) unterstützt.

Wo bietet die KI-Anwendung den größten Nutzen?

Der Demonstrator »Pneumo.AI« wurde entwickelt, um spielerisch zu verdeutlichen, wie KI-Technologien und medizinisches Fachpersonal zusammenarbeiten können. Die Krankheit Pneumonie, besser bekannt als Lungenentzündung, beschäftigt in vielen Krankenhäusern spezialisierte Fachärztinnen und Fachärzte. Bislang mussten mögliche Erkrankungen unter anderem anhand von Röntgenbildern manuell identifiziert werden, um rechtzeitig entsprechende Behandlungen einzuleiten. Heute können Bilderkennungssysteme bei einer Diagnose unterstützen. Das spart Zeit und kann Fehleinschätzungen vermeiden.

Was ist Pneumonie?

Bei der Pneumonie handelt es sich um eine akute Entzündung der unteren Atemwege, gemeinläufig wird sie auch als Lungenentzündung bezeichnet. Anders als man gegenwärtig vermuten würde, stellt die Lungenentzündung in vielen Regionen der Erde auch heute noch eine schwerwiegende Erkrankung dar. Insbesondere in Entwicklungsländern sind Pneumonien eine der häufigsten Krankheits- und Todesursachen von Kindern im Alter von unter fünf Jahren.

Wie KI bei der Diagnose helfen kann?

Systeme der Künstlichen Intelligenz können Ärzt*innen bei der Diagnosestellung unterstützen. In diesem Fall hilft die sogenannte Computer Vision, also das Maschinelle Sehen, dabei, Erkrankungsmerkmale auf Thorax-Scans zu erkennen.

Wie sieht die Zukunft von KI in der Medizin aus?

Sowohl Ärzt*innen als auch Data Scientists sehen großes Potenzial für KI in der Medizin. In vielen Krankenhäusern liegen große Mengen an Daten vor, die für eine verbesserte Diagnoseunterstützung genutzt werden könnten. Wichtig ist dabei allerdings, dass die KI-Systeme immer nur als Assistenztools verstanden werden und das medizinische Personal stets die Entscheidungshoheit hat. Medizinische Daten sind zudem sehr sensibel und müssen besonders geschützt werden.

Was sind die Qualitätsmerkmale von »Pneumo.AI«?

Geringer Aufwand: Da die Annotation von medizinischen Bilddatensätzen meist einen hohen Aufwand darstellt, ist es wichtig, dateneffiziente Algorithmen zu entwickeln, um einen möglichst geringen Annotationsaufwand zu erreichen.
Direkte Auswertung: Die Verwendung von KI-Technologien macht eine direkte Auswertung des Scans/Röntgenbilds nach der Aufnahme möglich – ohne menschliche Interaktion. Darin zeigt sich das Potenzial, die Arbeitsprozesse in Kliniken zu optimieren, beispielsweise durch die Entwicklung eines Priorisierungssystems. Wichtig ist jedoch, dass die KI immer als Assistenzsystem für Ärzt*innen fungiert und niemals allein entscheidet.
Sichere Datenverarbeitung: Bei sensiblen Daten wie Patient*innendaten ist es essenziell, dass die angewandten KI-Verfahren sicher sind. Alle Daten müssen auf deutschen Servern liegen oder dürfen ausschließlich vor Ort bei Fachärzt*innen bzw. an Kliniken verarbeitet werden.
Leistungsstarke KI: Künftig wird bei der Auswertung von medizinischen Bilddaten auch die KI-basierte multimodale Analyse eine wichtige Rolle spielen, da einem Arzt / einer Ärztin während der Diagnose viele verschiedene Informationen zur Verfügung stehen, die den Gesundheitszustand bzw. Krankheitsverlauf von Patient*innen betreffen.

»Eine enge Zusammenarbeit zwischen medizinischen Expert*innen und Data Scientists stellt die wichtigste Grundlage für den Einsatz von Künstlicher Intelligenz in der Medizin dar.«

Helen Schneider

Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS

Welche KI-Technologie steckt im KI.NRW-Demonstrator?

Deep Learning

Der Demonstrator Pneumo.AI beruht auf tiefen Künstlichen Neuronalen Faltungsnetzwerken (Convolutional Neural Network, kurz CNN), die für die Verarbeitung von größeren Bilddatensätzen besonders gut geeignet sind. Hierbei kann die verwendete Technologie auch auf andere Krankheiten und Use Cases übertragen werden.

Informed Machine Learning

Bei dieser Art des Maschinellen Lernens werden zur Verfügung stehende Vorkenntnisse und Expert*innenwissen in das Modell integriert, um beispielsweise dateneffizientere Algorithmen zu entwickeln. Für Pneumo.AI wurden die Elemente der bilateralen Symmetrie des Lungenfeldes innerhalb der Modellierung berücksichtigt.

Computer Vision

Um eine gute Generalisierungsfähigkeit des trainierten Netzwerkes zu gewährleisten, werden verschiedene Augmentationstechniken implementiert. Durch das Rotieren und Zoomen der Trainingsbilddaten erreicht das Netzwerk eine bessere Leistung, Overfitting wird vermieden.

Was zeigt der KI-Demonstrator?

Der Demonstrator »Pneumo.AI« zeigt, wie KI-Technologien in Zukunft Ärzt*innen in Praxen und Kliniken in ihrem Alltag unterstützen können. Hierbei ist es wichtig zu betonen, dass die Künstliche Intelligenz dem medizinischen Fachpersonal als Assistenztool zur Verfügung steht, die Endscheidungshoheit aber beim Menschen bleibt. Außerdem verdeutlicht der Demonstrator das hohe Potenzial von KI in der medizinischen Bildverarbeitung.

Jetzt unverbindliches Gespräch mit unseren Expert*innen anfragen!

Neugierig geworden? Hier geht es zum Demonstrator!

Jetzt ausprobieren

Wo sind weitere Informationen zu finden?

KI.Landkarte mit Einträgen im medizinischen Bereich

KI-Anbieter, Anwendungen und KI-Produkte »made in NRW« mit dem gleichen KI-Schwerpunkt finden Sie über die Filter- und Suchfunktion der KI.Landkarte, die aktuell mehr als 1000 Einträge umfasst.

Zur KI.Landkarte

Vortrag zu Pneumo.AI auf der Messe MEDICA 2022

Auf der internationalen Medizin-Fachmesse MEDICA 2022 hielten KI.NRW und das Fraunhofer IAIS einen Vortrag über »Künstliche Intelligenz im Gesundheitswesen am Beispiel Pneumo.AI«

Zum Vortrag

SmartHospital: Einsatz von KI im Krankenhaus der Zukunft

Im KI.NRW-Flagship-Projekt SmartHospital.NRW werden Werkzeuge entwickelt, um Krankenhäuser bei der digitalen Transformation und dem Einsatz von KI zu unterstützen. Ermitteln Sie jetzt den KI-Reifegrad Ihres Krankenhauses.

Zum KI-Readiness-Check

Kontakt zum Team der Entwickler*innen

Helen Schneider

Data Scientist – Computer Vision

Fraunhofer IAIS
Schloss Birlinghoven
53757 Sankt Augustin

Telefon +49 2241 14-2735

E-Mail senden

Dr. Rafet Sifa

Geschäftsfeldleiter Cognitive Business Optimization

Fraunhofer IAIS
Schloss Birlinghoven
53757 Sankt Augustin

Telefon +49 2241 14-2405

E-Mail senden

Bilderkennung und -verstehen

Intelligente Dokumentenanalyse »recognAIze«

Vorteile

Präzision & Qualität
Zeiteffizienz & Agilität

Funktionsbereiche

Assistenz / Support / Stabstellen
Einkauf / Beschaffung
Finanzen / Recht
Forschung / Entwicklung
IT / Infrastruktur
Lager / Logistik
Management / Projektmanagement
Marketing / Absatz
Personalwesen
Produktion / Montage
Service / Kundendienst
Vertrieb / Verkauf
Webdesign / Kommunikation

Zum demonstrator

→ Zu recognAIze

Zur Übersicht

Bilderkennung und -verstehen

Intelligente Dokumentenanalyse »recognAIze«

Mit der intelligenten Dokumentenanalyse von recognAIze können Daten aus Dokumenten erkannt und automatisiert ausgewertet werden.

Wo bietet die KI‐Anwendung den größten Nutzen?

Die manuelle Sichtung von Belegen, Rechnungen und anderen Dokumenten, ihre digitale Erfassung und Bereitstellung ist in vielen Unternehmen sowie Verwaltungsinstitutionen mit einem hohen Zeit- und Kostenaufwand verbunden. Die Lösung liefern intelligente Dokumentenanalysesysteme auf Basis von Optischer Zeichenerkennung (OCR), die wie »recognAIze« eine schnelle, einfache und automatisierte Analyse sowie eine Blindverarbeitung aller Arten von Dokumenten ermöglichen. Die Unterlagen werden dank Künstlicher Intelligenz automatisch erfasst, ausgelesen, zugeordnet und weiterverarbeitet. Beschädigte Originale, qualitativ minderwertige Scans von Dokumenten sowie insbesondere auch vertrauliche Unterlagen werden ohne weiteres Zutun des Menschen und nach hohen Datenschutzstandards verarbeitet.

Was sind die Qualitätsmerkmale bei solchen KI‐Anwendungen?

Die Grundlage der Dokumentenanalyse bilden die zu analysierenden Inputdaten. Da die Dokumente meist in schwankender Bildqualität erfasst werden, ist eine automatisierte Bildverbesserung in der KI-Anwendung sehr wichtig.

Die KI-basierte optische Zeichenerkennung (OCR) mittels Künstlicher Neuronaler Netze sorgt dafür, dass nicht nur einzelne Textzeichen erkannt und verarbeitet werden, sondern auch Textpassagen und die Struktur eines Dokumentes (z.B. Kopf- oder Fußzeilen).

Durch eine Layout-Analyse kann die KI-Anwendung auch Tabellen in einem Dokument identifizieren und die Inhalte interpretieren, um beispielsweise Rechnungen automatisiert in der Buchhaltung zu verarbeiten.

Insbesondere bei sensiblen Informationen müssen die angewandten KI-Verfahren sicher sein und alle Daten DSGVO-konform auf deutschen Servern oder On-Premise beim Kunden verarbeitet werden.

Künftig wird in den Anwendungen auch die Handschrifterkennung (ICR) eine Rolle spielen, um zusätzliche Anwendungsfelder zu erschließen und eine vollständige Überführung von Inhalten zu erreichen.

Welche KI‐Technologie steckt im KI.NRW‐Demonstrator?

Deep Learning‐OCR

Die optische Zeichenerkennung (Optical Character Recognition OCR) kombiniert mit Convolutional Neural Networks (CNN) und Long Short-Term Memory (LSTM) zwei aktuelle Ansätze im Bereich der Künstlichen Intelligenz, um aus Pixeln Zeichen zu entwickeln. Sie entnimmt den Bildern ihre Texte und generiert für jedes Dokument eine strukturierte XML Datei mit Positionsdaten der erkannten Wörter und Seitenbereiche.

Bildverbesserung

Für bestmögliche Qualität der Ergebnisse müssen negative Einflussfaktoren wie eine mangelnde Belichtung des gescannten Dokuments oder eine Wölbung bzw. Verzerrung im Bild ausgeglichen werden. Die eingesetzten Algorithmen zur Bildverbesserung führen dafür eine Umwandlung in Graustufen und eine Binarisierung durch. Außerdem werden Verfahren zur Entfernung von Wölbungen und anderen Störfaktoren genutzt.

Layouterkennung

Die Layouterkennung erkennt die Struktur von Text und hilft dabei, die erkannten Zeichen in Spalten, Textabschnitte oder Überschriften einzuteilen und eine Lesereihenfolge zu bestimmen. So können auch Tabellenstrukturen erkannt und als solche wieder ausgegeben werden, z.B. in einem csv-Format. Das Ausgabeformat wird mit entsprechenden Metadaten versehen.

»Durch die genutzten Methoden zur Bildverbesserung, Layout-
und Zeichenerkennung können selbst Dokumente in schlechter
Qualität ausgewertet werden.«

Dr. Nicolas Flores-Herr

Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS

Was zeigt der KI.NRW‐Demonstrator?

Der KI.NRW-Demonstrator »recognAIze« macht eine KI-gestützte Dokumentenanalyse erlebbar. Über die Anwendung können Ihre eigenen abfotografierten oder eingescannten Dokumente in das System hochgeladen werden und stehen dort zum Testen der intelligenten Dokumentenanalyse zur Verfügung. Die Animationen führen Schritt für Schritt durch die im Demonstrator genutzten KI-Technologien.

Dokumente optimieren

Häufig besitzen abfotografierte oder eingescannte Dokumente eine schwankende Bildqualität, sind teilweise verwellt, zerrissen oder verschmutzt. Bildverbesserungsverfahren sorgen dafür, dass selbst alte oder beschädigte Schriftstücke verarbeitet werden können. Der Demonstrator »recognAIze« führt anschaulich durch die Bandbreite der Optimierungsmöglichkeiten, die für eine hochwertige Dokumentenanalyse unverzichtbar sind.

Zeichen und Strukturen erkennen

Die Treffsicherheit und Geschwindigkeit der OCR-Engine zur intelligenten Zeichenerkennung von »recognAIze« ist höher als die führender Marktteilnehmer. Ohne Templates und händische Nachbereitung erkennt der Demonstrator die Layouts der Dokumente, z.B. Absenderinformationen oder Datumsangaben. Selbst komplexe Textinhalte wie Text-um-Bild-Elemente werden durch die Anwendung sicher erkannt.

Tabellen verstehen

Eine besondere Herausforderung bilden Tabellen, da sie von Dokument zu Dokument unterschiedlich aufgebaut sein können. KI-Methoden sind dafür verantwortlich, dass Tabelleninhalte nach Informationsarten unterteilt und die Segmente einzeln interpretiert werden können.

Inhalte klassifizieren

Der Demonstrator »recognAIze« ermittelt die Eigenschaften des Dokumentes, bewertet die einzelnen Elemente und ermöglicht dadurch eine ganze Reihe von anschließenden Weiterverarbeitungen. Durch die intelligente Klassifikation wird beispielweise die Blindverarbeitung von vertraulichen Dokumenten überhaupt erst möglich. Das bedeutet, dass Informationen aggregiert oder pseudonymisiert genutzt werden können, ohne dass ein Mensch Einsicht in die Dokumente erhält. Auf diese Weise können sensible, personenbezogene Daten besser geschützt werden.

Schnittstellen bilden

Die KI-gestützte Dokumentenanalyse steht häufig am Anfang einer Prozesskette, ob nun in der Buchhaltung oder in Archiven. Damit die weiteren Verarbeitungsschritte anschließen können, bietet der KI.NRW Demonstrator verschiedene Ausgabeformate wie XML oder PDF.

Neugierig geworden?
Hier geht es zum Demonstrator!

Jetzt ausprobieren

Wo sind weitere Informationen zu finden?

Studie »Moderne Sprachtechnologien«

Erfahren Sie, an welchen Stellen moderne Sprachtechnologien uns im Alltag und Beruf begegnen und welche wirtschaftlichen Möglichkeiten damit verbunden sind.

Zur Studie

KI-Produkte »Made in NRW«

Filtern Sie unsere KI-Landkarte nach dem Schwerpunkt »Sprach- und Textverstehen«:

Zur KI-Landkarte

KI-Anbieter aus NRW

Unsere KI-Landkarte zeigt Ihnen, wer KI-Methoden rund um das Sprach- und Textverstehen in seinem Portfolio hat.

Zur KI-Landkarte

Kontakt rund um den Demonstrator

Dr. Nicolas Flores-Herr

Geschäftsfeldleiter Document Analytics

Fraunhofer IAIS
Schloss Birlinghoven
53757 Sankt Augustin

Telefon +49 2241 142532

Email schreiben

Dr. Iuliu Konya

Senior Research Engineer

Fraunhofer IAIS
Schloss Birlinghoven
53757 Sankt Augustin

Telefon +49 2241 142543

Email schreiben

Marius Nißlmüller

Studentische Hilfskraft Unternehmensentwicklung

Fraunhofer IAIS
Schloss Birlinghoven
53757 Sankt Augustin

Email schreiben

Bilderkennung und -verstehen

Bildbasierte Qualitätskontrolle »Damage Detection«

Vorteile

Entlastung & Komfort
Präzision & Qualität
Zeiteffizienz & Agilität

Funktionsbereiche

Lager / Logistik
Produktion / Montage

Zum demonstrator

→ Zum Film über »Damage Detection«

Zur Übersicht

Bildbasierte Qualitätskontrolle »Damage Detection«

Automatisierte Inspektion von Schäden und Fehlern durch eine KI-gestützte Qualitätskontrolle von reflektierenden Oberflächen.

Wo bietet die KI-Anwendung den größten Nutzen?

Die Prüfung von reflektierenden Oberflächen, beispielsweise von Qualitätsmängeln in der Produktion oder Schäden an Fahrzeugen, werden häufig noch manuell durchgeführt und fallen daher zeitaufwändig aus und benötigen einen hohen Sachverstand der betrauten Personen. Um die Produktivität der Prozesse zu steigern, wurde mit »Damage Detection« ein KI-System zur Qualitätskontrolle glänzender oder diffus reflektierender Oberflächen entwickelt. Es eignet sich für ein breites Spektrum von Anwendungsmöglichkeiten: von der industriellen Produktion, zum Beispiel in der Automobilbranche, über die Leasing- und Versicherungsbranche bis hin zu KFZ-Gutachten. Das Damage Detection System arbeitet automatisiert und braucht für die Oberflächeninspektion weniger als eine Minute. Es kategorisiert die gefundenen Qualitätsdefekte mit Hilfe von Deep Learning. Die Kombination von Deflektometrie, also der berührungsfreien Erfassung reflektierender Oberflächen, herkömmlichen Bilderkennungsverfahren und Methoden der Künstlichen Intelligenz machen das System einzigartig.

Was sind die Qualitätsmerkmale bei solchen KI-Anwendungen?

»Damage Detection« bietet als Lösung geringe Hardware- und Wartungskosten. Die KI-Anwendung ist flexibel einsetzbar und in bestehende Produktionen nachrüstbar. Die Lösung ist u.a. in der Lage, unter dem Einfluss von Streulicht (z.B. Deckenbeleuchtung in einer Halle) zu arbeiten.
Das System liefert eine 100%ige Testabdeckung. Es vereint eine hohe Genauigkeit mit geringem Hardwareaufwand. Derzeit können Fehler von einer Größe von 0.1 mm auf 1 m Bauteilgröße erkannt werden.
Durch den Einsatz der Künstlichen Intelligenz können im System verschiedene Fehlermerkmale der Oberflächen trainiert werden.
Zusätzlich zu hochreflektierenden Oberflächen können durch neuste Entwicklungen auch diffus reflektierende Oberflächen auf ihre Qualität geprüft werden.

»Die Kombination aus herkömmlichen Bilderkennungsverfahren,
KI-Methoden und der Erfassung reflektierender Oberflächen
ist einzigartig.«

Dr. rer. nat. Theresa Bick

Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS

Welche KI-Technologie steckt im KI.NRW-Demonstrator?

Computer Vision

Die Lösung setzt auf Convolutional Neural Networks (CNNs) zur Detektion und Klassifikation der Oberflächenanomalien. Das CNN-Modell gehört zu den Künstlichen Neuronalen Netzen, welche für Bilderkennung und -verstehen geeignet sind.

Informed Machine Learning

Durch das Einbinden von Expertenwissen ist das System in der Lage, die datenhungrigen neuronalen Netze für die industrielle Produktion praktikabel zu machen. Die Trainingsdatenmenge und der Annotationsaufwand können vergleichsweise gering gehalten werden.

Kombination mit klassischer Bildverarbeitung

Die KI ist mit klassischer Bildverarbeitung gekoppelt. Das System verwendet dabei die Vorteile aus beiden Welten – schnelle, approximative Algorithmen aus der klassischen Bildverarbeitung und die mächtigen Verfahren des Deep Learnings.

Was zeigt der KI-Demonstrator?

Qualitätskontrolle glänzender oder diffus reflektierender Oberflächen zeichnet sich durch einen einfachen, mobilen Hardwareaufbau aus. Es arbeitet unabhängig vom Umgebungslicht und arbeitet vollständig automatisiert. Für die Oberflächeninspektion braucht es weniger als eine Minute.