Deep Learning in der Medizin unterstützt Ärzt*innen und hilft, Zeit zu sparen. Bei der Entwicklung von Medizinprodukten stehen Forscher*innen vor der Herausforderung, robuste, klinisch anwendbare Algorithmen zu erstellen, die repräsentativ für alle Krankheitsszenarien sind, in denen der Algorithmus arbeiten soll. Fraunhofer MEVIS bietet mit Software und Services Hilfestellung für entsprechende KI-Projekte. Im Interview erzählen Dr. Annika Hänsch und Farina Kock, wissenschaftliche Mitarbeiterinnen am Fraunhofer-Institut für Digitale Medizin MEVIS, wie sie KI-Projekte umsetzen.
Alle reden von KI in der Medizin. Wo wird KI denn heute schon eingesetzt?
Annika Hänsch: Bei Fraunhofer MEVIS arbeiten wir viel mit Bilddaten. Ein typisches Einsatzgebiet von KI in der medizinischen Bildverarbeitung ist die Tumorerkennung. KI hilft zum Beispiel bei der Segmentierung von Lebertumoren, also dabei, Konturen eines Tumors in der Leber auf einem radiologischen Bild einzuzeichnen, und zwar völlig automatisiert. So wird eine computergestützte Diagnostik oder Therapieplanung vereinfacht. Die manuelle Konturierung ist zum einen sehr zeitaufwendig, zum anderen kann die KI aber auch bei der Detektion von Tumoren unterstützen oder das Stadium eines Tumors beschreiben. Andere Anwendungsgebiete sind zum Beispiel Brust- oder Lungenkrebs. Auch sehr spannend ist die Erzeugung von künstlichen Bilddaten. Inzwischen gibt es Verfahren, die mit Hilfe von KI MRT-Bilder in synthetische CT-Bilder umwandeln. So können Daten für die Forschung generiert werden, ohne dass Patienten durch die Röntgenstrahlung belastet werden.
Wenn Sie eine neue KI-Initiative starten: Mit welchen Daten trainieren Sie Ihre KI? Und worauf kommt es bei der Datenauswahl an?
Farina Kock: In den meisten Projekten arbeiten wir mit retrospektiven Daten, entweder aus der klinischen Routine oder aus klinischen Studien. Wir arbeiten mit Daten verschiedenster Modalitäten, zum Beispiel CT, MRT oder Ultraschall, abhängig von der klinischen Anwendung. Um beim Beispiel der Lebertumor-Segmentierung zu bleiben: Hier arbeiten wir mit Datensätzen, in die das medizinische Fachpersonal manuell die Konturen der Tumore eingezeichnet hat. Diese dienen als eine Art Grundwahrheit, die wir dem Algorithmus zum Lernen zur Verfügung stellen. Im Training sieht der Algorithmus viele Beispiele dafür, wie das Ergebnis der Segmentierung auf den Trainingsdaten aussehen soll. Mit Hilfe von Optimierungsverfahren lernt der Algorithmus, das gewünschte Ergebnis immer besser nachzubilden.
Annika Hänsch: Wir brauchen deswegen große Datensätze, die die vorhandene Variabilität möglichst gut abbilden. Dies umfasst zum Beispiel das Geschlecht und Gewicht oder die Herkunft der Patient*innen, aber auch unterschiedlich starke Krankheitsverläufe, von Menschen mit teilresezierten Lebern, mit und ohne Leberzirrhose und viele weitere Faktoren. Je nach Anwendung müssen Daten aus verschiedenen Kliniken, von verschiedenen Bildgebungsgeräten und aus den für die Zulassung relevanten Regionen verwendet werden, um einen repräsentativen Datensatz zu gewährleisten. Der Algorithmus muss auf all diesen Daten trainiert werden, damit er auch in der klinischen Anwendung robust arbeitet. Ein guter Algorithmus, der gelernt hat, wie Leber, Arterien und Tumore in verschiedenen Variationen aussehen, kann dann auf Knopfdruck die Kontur des Lebertumors vorschlagen. Die Ärzt*innen können sich das Ergebnis ansehen, gegebenenfalls korrigieren, und gewinnen so viel schneller einen Überblick. Mit solchen Algorithmen können wir in Richtung wirklich individualisierter Medizin gehen.
Wie bauen Sie ein KI-Projekt auf? Und wie entwickeln Sie Ihre Lösungsansätze?
Farina Kock: Wir finden es sehr wichtig, sich mit den Ärzt*innen auszutauschen und das Problem zu definieren. Wir denken uns hinein in den klinischen Workflow und die klinischen Leitlinien, zum Beispiel in der Diagnosestellung. Dann schauen wir, ob sich der Prozess automatisieren oder unterstützen lässt. Eine typische Anwendung in der Pathologie ist das Detektieren und Klassifizieren von Zellen unter dem Mikroskop. Diese Aufgaben sind zeitintensiv und involvieren viele händische Prozesse, die ein ideales Anwendungsgebiet für KI darstellen. Zusätzlich ermöglicht KI die verzahnte Nutzung von Daten über einzelne Patient*innen hinaus, um neue Informationen zu gewinnen.
Annika Hänsch: Anderes Beispiel: Wir arbeiten im Fraunhofer MEVIS-Projekt SIRTOP an Selektiver Interner Radiotherapie – kurz SIRT. Die Idee: Man spritzt kleine radioaktive Kügelchen über die Arterie in die Leber, um eine Strahlentherapie lokal durchzuführen – quasi von innen. Dazu muss man mit einem Katheter in die Gefäßabschnitte, über die alle tumorversorgenden Arterien erreicht werden, um die strahlenden Kügelchen vor allem in Tumornähe platzieren zu können. Das Ziel ist, die Radiolog*innen bei der Planung des Eingriffs und bei der Navigation während der Intervention zu unterstützen, damit diese sicherer und schneller erfolgt. Als Lösung erzeugen wir mittels KI Segmentierungen von Leber, Tumor und Gefäßen, die genau zeigen, wie der Weg durch den Gefäßbaum zum Tumor aussieht.
Sie entwickeln, die eine Zulassung brauchen. Wie garantieren Sie die Qualität der Algorithmen?
Annika Hänsch: MEVIS entwickelt nur Komponenten für spätere Medizinprodukte. Der Schritt der Zulassung wird meist von unseren Kooperationspartnern vollzogen. Wichtig ist dabei immer, dass man zur Validierung der Algorithmen Testdatensätze hat, die nicht im Training verwendet wurden. Normalerweise legt man zu Beginn eines Projektes einen möglichst repräsentativen Teil der Daten zur Seite. Erst in der finalen Lösung nutzt man diese Daten, um zu prüfen, ob das Projekt die von den Kund*innen gewünschte und vorher festgelegte Genauigkeit von sagen wir 90 % tatsächlich erreicht.
Farina Kock: All dies muss nach einem festgeschriebenen Prozess genau dokumentiert werden. Und natürlich müssen Ärzt*innen in der Anwendung der Algorithmen immer noch die Möglichkeit haben, die Ergebnisse der KI noch einmal anzusehen. Je weniger Ärzt*innen nachkorrigieren können oder wollen, desto anspruchsvoller ist die Zulassung und desto strenger sind die Kontrollmechanismen. Generell muss anhand klinischer Daten nachgewiesen werden, dass die mit dem Produkt verbundenen Risiken in angemessenem Verhältnis zu dem resultierenden Nutzen stehen. Für ein Produkt, bei dem eine Diagnose vorgeschlagen wird, ohne dass Ärzt*innen die KI-Entscheidung im Detail nachvollziehen können, ist das ein komplexe Herausforderung. Bei der Akzeptanz der KI durch das klinische Personal kommt es aber auch darauf an, ob die Entscheidungen einer KI verstehbar sind. Das klinische Team trägt am Ende die Verantwortung für die Behandlung der Patient*innen.
Wie wird garantiert, dass die Hilfestellung für die Ärzt*innen auch zukunftssicher ist?
Annika Hänsch: Wenn KI-Algorithmen in ein Produkt integriert werden, liefert man derzeit nicht das lernende System im eigentlichen Sinne, sondern einen eingefrorenen Zustand mit den Parametern, die in der Trainingsphase erlernt wurden. Dieser Stand wird an die Kund*innen weitergegeben. Dazu gibt es eine genaue Spezifikation, die beschreibt, welche Daten der Algorithmus verarbeiten kann, zum Beispiel Bilder von Hersteller XY mit einer bestimmten Bildgebungssequenz. Wenn also die Geräte aktualisiert werden und sich in Folge die Daten ändern, dann müssen wir im Endeffekt unsere Algorithmen neu validieren und gegebenenfalls weiter oder neu trainieren. Letzten Endes sind KI-Algorithmen in der Medizin nichts Statisches, sondern entwickeln sich mit der medizinischen Forschung immer weiter.
Mehr Infos zum Thema Deep Learning in Medical Imaging in Zusammenarbeit mit Fraunhofer MEVIS
Unsere Expertinnen im Interview
Farina Kock
Wissenschaftliche Mitarbeiterinnen
Fraunhofer-Institut für Digitale Medizin MEVIS
Dr. Annika Hänsch
Fraunhofer-Institut für Digitale Medizin MEVIS
Jutta Haubenreich ist seit 2009 in wechselnden Rollen bei Fraunhofer Academy tätig. Sie war u.a. für das übergreifende Marketing der Fraunhofer Academy und für die Betreuung und Vermarktung von Fraunhofer-Weiterbildungsprogrammen im Bereich Energie und Nachhaltigkeit zuständig. Aktuell betreut sie insbesondere die Fraunhofer Wasserstoff Education Community. Von 2011 bis 2017 war sie Projektleiterin und Koordinatorin des BMBF-Verbundprojektes »mint.online: Berufsbegleitende Studienangebote in MINT-Fächern«.
Von 2015 bis 2022 promovierte sie berufsbegleitend am Institut für Kommunikationswissenschaft und Medienforschung der LMU München zum Thema »Der Einfluss des Fernsehens auf Bildungsmotivation und -entscheidung«.