© woravut – stock.adobe.com

Artikel • Deutscher Krebskongress 2026

Large Language Models in der Onkologie: Potenzial trifft auf Infrastrukturprobleme

Auf dem Deutschen Krebskongress in Berlin diskutierten Experten aus München, Köln, Hamburg und Dresden den Einsatz von Large Language Models (LLMs) in der Krebsmedizin. Die Session zeigte beeindruckende technische Möglichkeiten, offenbarte aber auch fundamentale Schwächen in der deutschen Dateninfrastruktur.

Von Michelle Gresbek

Jedes Krankenhaus erzeugt pro Jahr etwa 50 Petabyte an Daten, 80% davon liegen unstrukturiert vor und werden nicht genutzt. Das berichtete PD Dr. Lisa Adams von der TU München. Genau hier setzen Large Language Models an. Die transformerbasierten neuronalen Netze können klinisches Wissen codieren, Patientenakten strukturiert extrahieren und bei Therapieentscheidungen unterstützen. 

Die Forschungslandschaft entwickelt sich rasant. Ein systematisches Review vom August 2025 screente bereits 15.000 Artikel zu LLMs in der Onkologie. Bemerkenswert: 83% der Studien nutzten allgemeine Sprachmodelle wie ChatGPT oder Claude, nur 17% setzten onkologiespezifische Modelle ein.1 

Dieser Artikel könnte Sie auch interessieren

Photo

Artikel • Künstliche Intelligenz in der Inneren Medizin

Medizinische KI: Auftritt der ‚Dea ex machina‘

In der Welt des Theaters ist der ‚Deus ex machina‘, der Gott aus der Maschine, ein dramaturgischer Kniff, um scheinbar unlösbare Konflikte zu klären. Kann Künstliche Intelligenz (KI) für die Innere Medizin ebenfalls ein solcher universeller Problemlöser sein? Auf dem DGIM-Jahreskongress in Wiesbaden ging Dr. Isabella Wiest dem Potenzial – und den Limitationen – der KI-Helfer nach.

Adams verwies auf RAG-gestützte Ansätze, die LLMs mit aktueller Wissensbasis unterlegen. Einen weiteren Fortschritt sieht sie in agentischen Workflows, bei denen mehrere Sprachmodelle für unterschiedliche Aufgaben zusammenarbeiten. Eine Studie der Arbeitsgruppe um Prof. Jakob Nikolas Kather, publiziert in Nature Cancer2, konnte die Genauigkeit von GPT-4 bei komplexen Krebsfällen deutlich steigern. 

Deutschlands Daten-Dilemma

In ganz Deutschland gibt es keine einzige Klinik, die alle Patientendaten auf einer Plattform hat. Keine einzige Klinik. Man kann sich gar nicht vorstellen, was da verloren geht an Informationen

Thomas Elter

PD Dr. Thomas Elter von der Uniklinik Köln lieferte den Realitätscheck: Deutschland macht sich eine Illusion, wenn es glaubt, mit Big Data in der KI-Forschung mitspielen zu können. Die Datenbasis sei extrem fragmentiert, Datenschutzvorgaben machten große Forschungsprojekte nahezu unmöglich. 

Elter illustrierte das Problem konkret: Das von Kather publizierte Nature-Paper arbeitete mit 20 Testfällen. Hätte sein Team Zugang zu chinesischen Dateninfrastrukturen gehabt, hätte er dasselbe Modell an 80.000 Echtfällen testen können. Das Ergebnis: 55% bis 60% der klinischen KI-Daten kommen aus China, ein Viertel aus den USA. Deutschland taucht in den Top 10 nicht auf. 

„In ganz Deutschland gibt es keine einzige Klinik, die alle Patientendaten auf einer Plattform hat. Keine einzige Klinik“, so Elter. Sein Haus in Köln müsse 38 Tumorboards pro Woche abhalten. Nach dem Ende einer SAP-Lizenz im Januar mussten alle Befunde manuell kopiert werden. „Man kann sich gar nicht vorstellen, was da verloren geht an Informationen.“ 

Sein Lösungsvorschlag orientiert sich an historischen Erfolgsmodellen: In den 1980er und 1990er Jahren bildeten sich universitätsübergreifende Studiengruppen, bei denen Deutschland führend wurde. Elter plädierte für eine German AI Oncology Group nach diesem Vorbild und schlug spontan Prof. Kather als Chef vor. 

KI-Prognose beim Pankreaskarzinom

François Schneider, Student im praktischen Jahr an der Charité Berlin, präsentierte Forschungsergebnisse aus der klinischen Anwendung, die kürzlich im European Journal of Cancer veröffentlicht wurden.3 Sein Team trainierte Machine-Learning-Modelle auf Daten von 1.040 Patienten mit Pankreaskarzinom. Die Modelle erreichten Vorhersagegenauigkeiten von 72% bis 79%. 

Die KI berechnete szenarische Was-wäre-wenn-Analysen. Bei Patienten, die das Chemotherapeutikum Folfirinox erhalten hatten, zeigte das Modell, dass 43% von einer gemcitabinbasierten Therapie profitiert hätten. Als wichtigste Variablen identifizierte das System den Tumormarker CA19-9, den Entzündungsmarker CRP und die Tumorlokalisation. Geplant ist nun eine prospektive klinische Studie zur Validierung. 

Chatbots empathischer als Ärzte

Dr. Martin Krusche vom Universitätsklinikum Hamburg-Eppendorf beleuchtete die Patientenperspektive. Eine deutschlandweite Befragung rheumatologischer Patienten Anfang 2025 ergab: Ein Viertel nutzt bereits KI-Systeme für Gesundheitsfragen, zwei Drittel können sich vorstellen, eine digitale Zweitmeinung einzuholen.4 

Krusche testete ChatGPT-4 mit den 100 relevantesten Lupus-Fragen eines europäischen Expertenkonsortiums.5 Das Ergebnis überraschte: Das Sprachmodell war den Ärzten in der Qualität signifikant überlegen und wurde als empathischer wahrgenommen. 

Praktische Anwendungen sieht Krusche bei der Vereinfachung von Arztbriefen. Ein Pilotprojekt am UKE erzeugt automatisch patientenfreundliche Versionen. 75% der Patienten bewerteten diese als verständlicher, 85% als sinnvoll. Der Aufwand: drei bis fünf Minuten pro Brief. 

Allerdings warnte Krusche vor unkritischer Nutzung. Er zeigte den Fall eines 60-jährigen Mannes, der sich durch ChatGPT-Ernährungsempfehlungen einen Bromismus zuzog, eine seltene Vergiftung durch übermäßige Bromidaufnahme als Kochsalzersatz.6 Die Frage der Haftung bei Fehlempfehlungen bleibe ungeklärt. 

Digitalisierung erhöht Stress (auf beiden Seiten)

Dr. Magdalena Wekenborg von der TU Dresden präsentierte eine unbequeme Wahrheit: Digitalisierung im Gesundheitswesen erhöht den Stress, statt zu entlasten. In einer 17-monatigen biopsychologischen Längsschnittstudie7 untersuchte sie zwei Universitätskliniken vor, während und nach Einführung eines digitalen Laborbuches. Das chronische Stresslevel stieg und blieb über ein Jahr erhöht. 

Wekenborg misst Stress mittels Wearables und identifiziert kritische Momente in der Mensch-Maschine-Interaktion. Ihre These: Bisherige Forschung krankt daran, dass Systeme im Labor statt im echten klinischen Workflow evaluiert werden. 

Ein weiterer Befund: Die Interaktion ist keine Einbahnstraße. Gestresste Ärzte stressen auch das LLM, mit messbaren Auswirkungen auf die Ausgabequalität. „Wenn ich jetzt eine Ärztin bin und frage mein Decision Support System, bin aber selbst total gestresst, stresse dadurch das System und verschlechtere dadurch meinen Output“, erklärte Wekenborg. 

Diskussion: Datenschätze heben

Die anschließende Diskussion kreiste um ein zentrales Thema: Warum schafft Deutschland es nicht, seine Krebsregisterdaten und klinischen Daten zu vernetzen? Ein Teilnehmer vom Deutschen Krebsforschungszentrum berichtete, dass ein Projekt an unterschiedlichen Datenschutzvorgaben der Bundesländer gescheitert sei. 

Prof. Kather ergänzte: Seine Arbeitsgruppe publiziert viel mit UK Biobank-Daten, habe es aber nie geschafft, vergleichbare deutsche Datenschätze zu heben. Bei der UK Biobank zahlt man 10.000 Euro und hat drei Jahre Zugriff auf hunderttausende Patientendaten. In Deutschland scheitert der Antrag beim Krebsregister an der Datensparsamkeit. 

Ein Vertreter der Frauenselbsthilfe Bonn bot Unterstützung an: „Die Daten gehören Patienten, und die Patienten sind sehr dafür, dass diese Forschung erfolgt.“ Auch die Frage nach Prompt-Kompetenz wurde diskutiert. Wekenborgs Antwort: Nicht nur Prompt-Training sei nötig, sondern vor allem Output-Supervision. 

Konsens herrschte in einem Punkt: KI ersetzt nicht die klinische Erfahrung, sondern erweitert sie. Die Session machte deutlich: Die Technologie ist reif. RAG-Systeme, agentische Workflows und Decision-Support-Tools funktionieren beeindruckend. Doch Deutschland kämpft mit hausgemachten Problemen. Der Vorschlag einer German AI Oncology Group wirkte wie ein Appell, die Konkurrenz zu vergessen und Ressourcen zu bündeln. 


Quellen: 

  1. Mehan N, Desinghe TD, Saha A: Development and evaluation of large-language models (LLMs) for oncology: A scoping review; PLOS Digital Health 2025. 
  2. Ferber D, El Nahhas OSM, Wölflein G et al.: Development and validation of an autonomous artificial intelligence agent for clinical decision-making in oncology; Nature Cancer 2025. 
  3. Schneider F, Chen H, Pelzer U et al.: The basis for future personalized therapy approaches – Machine learning-generated 1-year survival rate, metastatic status and therapy-dependent survival in pancreatic cancer patients; European Journal of Cancer 2025. 
  4. Labinsky H, Klemm P, Graalmann L et al.: Patient experiences, attitudes, and profiles regarding artificial intelligence in rheumatology: a German national cross-sectional survey study; Rheumatology International 2025. 
  5. Haase I, Xiong T, Rissmann A, Knitza J, Greenfiled J, Krische M: ChatSLE: consulting ChatGPT-4 for 100 frequently asked lupus questions; Lancet Rheumatology 2024. 
  6. Eichenberger A, Thielke S, Van Buskirk A: A Case of Bromism Influenced by Use of Artificial Intelligence; Annals of Clinical Medicine: Clinical Cases 2025. 
  7. Wekenborg MK, Harzbecker J, Bechmann N, Sbiera S, Gilbert S, Schwerdtfeger AR: Effects of digital transformation on stress-relevant working conditions and employees’ psychophysiological stress: A longitudinal, quasi-experimental control group study; Computers in Human Behavior Reports 2025. 

23.03.2026

Verwandte Artikel

Photo

News • Onkologie & IT

Daten aus Krebsregistern für die Nutzenbewertung nutzbar machen

Aktuell sind die klinischen Krebsregister noch nicht als primäre Datenquelle für die anwendungsbegleitende Datenerhebung geeignet. IQWiG-Autoren erklären, was dafür erforderlich wäre.

Photo

Video • Medikationsmanagement

Auf digitalem Weg zur sicheren Krebsmedikation

Der digitale Wandel macht die Medizin besser und effizienter: Bei der Medikation werden die Prozesse durch die Digitalisierung vereinfacht, verbessert und sicherer. Vor allem in der Krebstherapie…

Photo

News • Joint Imaging Platform (JIP)

Wenn die Daten nicht zum Algorithmus kommen...

Die neue „Joint Imaging Platform" – kurz JIP – ist eine flexible dezentrale Analyseplattform für medizinische Bilder. JIP wurde zunächst für die Standorte des Deutschen Konsortiums für…

Newsletter abonnieren