Visuelle Innovation durch KI in der Augenheilkunde
Die optische Kohärenz-Tomographie (OCT) ist ein schonendes Laser-Mikroskop und wird von Augenärzten eingesetzt, um die Netzhaut nach Anomalien zu untersuchen. Trainierte KI-Modelle unterstützen die Ärzte, die Pathologien zu erkennen.
-
Ausgangslage
Mit OCT-Scans lässt sich die feine Schichtstruktur der Netzhaut aufnehmen. Die Auswertung der 3D-Scans zum Beispiel nach Tumoren ist aber zeitaufwendig und war bisher wenig erprobt. Künstliche Intelligenz (KI) kann die Ärzte dabei unterstützen.
-
Lösung SCS
SCS trainierte ein modifiziertes U-Net-CNN-Modell für die Erkennung von Augenschichten und Tumoren. Die erreichte Genauigkeit ist äquivalent zu der von erfahrenen Augenärzten.
Das Modell läuft dockerisiert als Dienst auf einer On-Premise Plattform. -
Mehrwert
Durch die KI-Lösungen wird die Erkennung von Augenschichten und Tumoren in 3D-OCT-Scans automatisiert und beschleunigt. Das Modell funktioniert für verschiedene OCT-Geräte. Dadurch kann die KI auf für viele Augenärzte in der Forschung verwendet werden.
Detektion von Defekten im Auge
Aufgrund der intrinsischen 3D-Auflösung und der nicht-invasiven Benutzerfreundlichkeit wird OCT in Kliniken häufig zur Diagnose wesentlicher Augenerkrankungen eingesetzt, unter anderem bei altersbedingter Makuladegeneration, Glaukom, diabetischer Retinopathie und vitreo-retinaler Traktion.
Künstliche Intelligenz (KI) kann Ärzte dabei unterstützen, diese Pathologien in OCT-Scans effizienter zu erkennen. Die KI-gestützten Erkenntnisse werden von Ärzten ausgewertet und verkürzen die Zeit, die ein Arzt vor dem Computer verbringt. Und sie reduzieren potenziell die diagnostische Fehlerquote.
Daten labeln
Das Labeling der Augenschichten benötigt grosses Fachwissen – und viel Zeit. Mehrere Experten labelten pixelweise jeweils hunderte bis tausende OCT-B-Scans. SCS legte diese versioniert ab.
Entscheid für die Architektur des modifizierten U-Net
Als Grundlage wurde eine Recherche bezüglich der verwendeten CNN-Architekturen für eine semantische Segmentation für medizinische Bilder durchgeführt. Dabei hat sich das U-Net bewährt und erzielt nach wie vor state-of-the-art Ergebnisse, d.h. der resultierende Fehler entspricht dem nicht reduzierbaren Fehler. Oder in anderen Worten, das U-Net ist in seiner Genauigkeit nicht unterscheidbar von Ophthalmologie-Experten.
Resultate der Segmentierung ohne Tumorbilder
Das Projekt umfasst mehrere Studien und Auswertungen. Die unten beschriebene beschränkt sich illustratorisch auf eine Auswertung ohne Tumorbilder. Bei den Resultaten spielt der «Human Factor» eine grosse Rolle. Auch der Mensch produziert nicht eine 100% (siehe Zeile 1 in untenstehender Tabelle) konsistente Ground Truth (GT). Dadurch ist es sinnvoll, die Variationen der Segmentierung von verschiedenen Personen zu vergleichen. Als Mass für den Vergleich der Performance wurde die Hamming Distance verwendet. Das U-Net performt besser als die heterogene Gruppe der Labeler bestehend aus Laien, Optikern und professionellen Ophthalmologen.
Vergleich | Variation |
---|---|
Innerhalb GT (1 Experte, 3 mal repetiertes Labeling) | 1.3-1.7% |
GT und CNN | 1.4-1.7% |
10 Personen (Amateure, Optiker, Ophthalmologen) | 1.7-3.5% |
Reproduzierbarkeit
Der Software-Code wird in einem Git-Repository verwaltet. Datensets werden versioniert und «immutable» auf einem Netzlaufwerk abgelegt. Experimente werden in einem digitalen Lab-Journal geführt und finale Versionen (für Publikation[i] oder Produktion) zusätzlich versioniert. Die Reproduzierbarkeit ist in diesem Projekt extrem wichtig, da die Resultate für Publikationen verwendet werden.
Rollout und Betrieb
Das Backend läuft in einer On-Premise Infrastruktur in dockerisierten Containern und ist in Zukunft für die medizinische Gemeinschaft verfügbar. Benutzer laden Abfragen einschließlich ihrer anonymisierten OCT-Scans über eine benutzerfreundliche Weboberfläche hoch. Das Modell ermittelt anschließend das Volumen und die Flächen der Augenschichten und stellt dem Anwender die Ergebnisse über ein Web-Interface zur Verfügung.
Few-Shot Learning
Eine besondere Herausforderung ist die geringe Datenmenge von Tumoren innerhalb der Bilder. In einer weiteren Studie wurden dafür verschiedene Techniken für das künstliche Erzeugen von Ground-Truth-Daten ausprobiert. Ansätze mit Autoencoders lieferten verschwommene Ergebnisse. Erst der Einsatz von Generative Adversarial Networks (GANs) erlaubte eine zuverlässige künstliche Generierung von Tumorbildern.
Summary
Vorausgesetzt das genügend, d.h. hunderte bis tausende qualitativ hochwertige und pixelweise gelabelte OCT-Scan Bilder vorhanden sind, erkennt das U-Net medizinisch relevante Strukturen mit einer Genauigkeit, die mit menschlichen Ophthalmologie-Experten vergleichbar ist.
[i] Validation of automated artificial intelligence segmentation of optical coherence tomography images
Maloca PM, Aaron Y Lee, Emanuel R de Carvalho, Mali Okada, Katrin Fasler, Irene Leung, Beat Hörmann, Pascal Kaiser, Susanne Suter, Pascal W Hasler, Javier Zarranz-Ventura, Catherine Egan, Tjebo FC Heeren, Konstantinos Balaskas, Adnan Tufail, Hendrik PN Scholl Scholl (2019) Validation of automated artificial intelligence segmentation of optical coherence tomography images. PLOS ONE 14(8): e0220063