© Anna – stock.adobe.com (KI-generiertes Bild)

Artikel • Künstliche Intelligenz in der Inneren Medizin

Medizinische KI: Auftritt der ‚Dea ex machina‘

In der Welt des Theaters ist der ‚Deus ex machina‘, der Gott aus der Maschine, ein dramaturgischer Kniff, um scheinbar unlösbare Konflikte zu klären. Kann Künstliche Intelligenz (KI) für die Innere Medizin ebenfalls ein solcher universeller Problemlöser sein? Auf dem Jahreskongress der Deutschen Gesellschaft für Innere Medizin (DGIM) in Wiesbaden ging Dr. Isabella Wiest dem Potenzial – und den Limitationen – der KI-Helfer auf den Grund.

Artikel: Wolfgang Behrends

Vor allem der Aspekt der generativen KI zeigt enormes Potenzial, erklärte die Wissenschaftliche Mitarbeiterin am Else Kröner Fresenius Zentrum (EKFZ) für Digitale Gesundheit der TU Dresden und Assistenzärztin am Universitätsklinikum Mannheim. 

Jeder Mensch erzeugt auf seinem Weg durch Arztpraxen und Kliniken, aber auch im privaten Umfeld eine Menge gesundheitsbezogener Daten, die von einer KI auf klinisch relevante Muster hin analysiert werden könnten, so die Expertin. Beispiele dafür sind medizinische Befundtexte, radiologische Aufnahmen, histopathologische Bilder sowie Genom- und Sensordaten. 

Das Vorhandensein dieses Datenschatzes ist jedoch erst die halbe Miete, gab Wiest zu bedenken: Etwa 80% der Daten liegen in unstrukturierter Form vor1, im Freitext von Befunden sind oft relevante Zusatzinformationen enthalten, die über die strukturierten Daten hinausgehen.2 Um diese Informationen quantitativ nutzen zu können, ist bislang viel manuelle Nacharbeit nötig – etwa in Form eines Doktoranden, der die Daten aus den Arztbriefen in eine Tabelle überträgt.

Lokale Sprachmodelle behalten sensible Daten für sich

Diese undankbare Arbeit ließe sich an eine generative KI abtreten, erklärte die Expertin mit Blick auf die derzeit wohl bekannteste Anwendung: Das große Sprachmodell (LLM) ChatGPT von OpenAI. Das Programm wurde an großen Textkorpora trainiert und ist in der Lage, auf dieser Basis neue Inhalte zu generieren. Darunter fällt auch das Extrahieren von Informationen aus unstrukturierten Texten. So zeigt eine aktuelle Arbeit brauchbare Ergebnisse beim Auslesen von TNM-Stadien aus Pathologie-Befunden – selbst, wenn diese nicht in digitaler Form vorlagen.3

Der Einsatz der OpenAI-Lösung verbietet sich in diesen Fällen allerdings, da die sensitiven Patientendaten keinesfalls auf die Server des US-Unternehmens überspielt werden sollen, gab Wiest zu bedenken. Eine gangbare Alternative seien lokale Sprachmodelle wie Llama-2, die auf einem Computer vor Ort installiert werden können. „Damit bleiben die Daten dort, wo sie entstehen und verlassen nicht das Krankenhaus oder die Praxis.“ Trotz der ungleich geringeren Rechenleistung lieferte das lokale KI-Modell im Test mit gastroenterologischen Endoskopie-Befunden gute Ergebnisse, berichtete die Expertin.

[Retrieval-Augmented Generation] ist eine vielversprechende Technologie, die Ärzte nutzen können, um aktuelle Therapieempfehlungen präsent zu haben, wenn sie benötigt werden

Isabella Wiest

Erste Studien legen nahe, dass die LLMs auch beim inhaltlichen Zusammenfassen klinischer Texte gute Ergebnisse liefern. Diese seien zwar keinesfalls fehlerfrei, räumte Wiest ein – die KI-generierten Texte wiesen jedoch weniger Fehlinterpretationen und Ungenauigkeiten auf als die von menschlichen Experten.4 Der Einsatz dieser Tools, argumentierte die Expertin, könne durchaus „eine Arbeitserleichterung und Effizienzsteigerung schaffen, sodass mehr Zeit für den Patienten bleibt und weniger Zeit für die Dokumentation verwendet werden muss“.5 

Damit die LLMs medizinisch akkurate Informationen ohne die berüchtigten ‚Halluzinationen‘ liefern, müsse allerdings der Input stimmen, gab Wiest zu bedenken: Dafür müssten etwa aktuelle Leitlinien in Form maschinenlesbarer Vektoren in eine Datenbank eingespeist werden, sodass mithilfe des entsprechenden Prompts fundierte Antworten ausgegeben werden. Dieser Ansatz mit der Bezeichnung ‚Retrieval-Augmented Generation‘ (RAG) hat in ersten Versuchen bereits gute Ergebnisse erzielt, so die Expertin.6 „Das ist eine vielversprechende Technologie, die Ärzte nutzen können, um aktuelle Therapieempfehlungen präsent zu haben, wenn sie benötigt werden.“

Ein Algorithmus für alles – oder alle für einen?

Die zunehmende Digitalisierung von Gesundheitsdaten eröffne zahlreiche weitere Einsatzmöglichkeiten für KI, führte Wiest auf: Von der Vorhersage des MSI-Status zur Erkennung genetischer Veränderungen in der Histopathologie7,8,9 über die Organsegmentierung zur Unterstützung der chirurgischen Therapieplanung10 bis hin zur radiologischen Bildbeurteilung.11,12 Unabhängig vom Fachbereich sei es jedoch grundsätzlich extrem wichtig, gute Datengrundlagen zu haben und die trainierten Modelle sehr gut zu validieren, betonte sie. „Wir müssen gerade die generative KI sehr kritisch hinterfragen und gute Metriken entwickeln.“ Die Transparenz der Modelle und Erklärbarkeit der Ergebnisse, so ihr Fazit, müsse gewährleistet bleiben. 

Als Gegenentwurf zu den aktuellen, auf eng begrenzte Aufgabestellungen zugeschnittenen Modellen wendet sich neuere Forschung in Richtung einer ‚Generalisten‘-KI. Diese soll jedwede Datenmodalitäten aus Klinik und Praxis in eine Anwendung integrieren können und dadurch einen ganzheitlichen Blick auf medizinische Fragestellungen ermöglichen13 – ein Modell, das dem Konzept des Deus ex machina zumindest nahekommt.

Dieser Artikel könnte Sie auch interessieren

„Ob es dieses eine Modell geben wird, bleibt noch zu klären“, gab die Expertin mit Blick auf die hohe Komplexität zu bedenken. Anstelle einer einzelnen ‚Alleskönner‘-KI könnten auch einzelne, spezialisierte Modelle mithilfe einer übergeordneten KI – dem sogenannten LLM-Agent – orchestriert werden.14 Je nach klinischer Aufgabenstellung ‚konsultiert‘ dieser Über-Algorithmus die jeweils geeignete KI, um aus dessen Expertise eine Diagnostik- oder Therapieempfehlung zu generieren. 

Als letzte Hürde sprach Wiest die Einbindung der Modelle in bestehende Gesundheits-Infrastrukturen an. „Hier braucht es dringend Interoperabilität der digitalen Systeme.“ Bis zum Sprung der KI vom digitalen Helfer zur klinischen Dea ex machina sind also noch einige Herausforderungen zu meistern. 


Literatur: 

  1. Kong HJ: Managing Unstructured Big Data in Healthcare System; Healthcare Informatics Research 2019 
  2. Price SJ et al.: Is omission of free text records a possible source of data loss and bias in Clinical Practice Research Datalink studies? A case–control study; BMJ Open 2016
  3. Truhn D et al.: Extracting structured information from unstructured histopathology reports using generative pre-trained transformer 4 (GPT-4); The Journal of Pathology 2023 
  4. Van Veen D et al.: Adapted large language models can outperform medical experts in clinical text summarization; Nature Medicine 2024 
  5. Sinsky C et al.: Allocation of Physician Time in Ambulatory Practice: A Time and Motion Study in 4 Specialties; Annals of Internal Medicine 2016 
  6. Ferber D et al.: Large Language Models for Information Retrieval and Comparison of Medical Oncology Guidelines; Accepted for publication; NEJM AI 
  7. Coudray N et al.: Classification and mutation prediction from non–small cell lung cancer histopathology images using deep learning; Nature Medicine 2018 
  8. Naik N et al.: Deep learning-enabled breast cancer hormonal receptor status determination from base-level H&E stains; Nature Communications 2020 
  9. Kather JN et al.: Deep learning can predict microsatellite instability directly from histology in gastrointestinal cancer; Nature Medicine 2019 
  10. Wasserthal J et al.: TotalSegmentator: Robust Segmentation of 104 Anatomic Structures in CT Images; Radiology: Artificial Intelligence 2023 
  11. Wanders AJT et al.: Interval Cancer Detection Using a Neural Network and Breast Density in Women with Negative Screening Mammograms; Radiology 2022 
  12. Kim HE et al.: Changes in cancer detection and false-positive recall in mammography using artificial intelligence: a retrospective, multireader study; Lancet Digital Health 2020 
  13. Moor M et al.: Foundation models for generalist medical artificial intelligence; Nature 2023 
  14. Ferber D et al.: Autonomous Artificial Intelligence Agents for Clinical Decision Making in Oncology; arXiv 2024

13.05.2024

Verwandte Artikel

Photo

News • Künstliche Intelligenz

Wie große Sprachmodelle die Medizin voranbringen können

Unterstützung bei Diagnostik, Dokumentation und Versorgung: Eine Forschungsgruppe zeigt, wie Large Language Models (LLM) die Gesundheitsversorgung und Forschung verbessern könnten.

Photo

News • Zukunfts-Dialog in Essen

Digitalisierungs-Forum steckt Gesundheitswesen von morgen ab

Medizinische KI und Interoperabilität jenseits von Datensilos – so lautet der Schlüssel für eine zukunftsfähige Gesundheitsversorgung, zeigten sich Experten auf einem Fachforum überzeugt.

Photo

Artikel • Intensivmediziner gründen neue Sektion

Mit Digitaler Medizin mehr Leben retten

KI, Robotik, Präzisions- und Telemedizin: Der digitale Fortschritt des Gesundheitswesens zeigt sich in der Intensiv- und Notfallmedizin besonders deutlich. Doch die Einführung neuer Technik in den…

Verwandte Produkte

Newsletter abonnieren