Artikel • Deutscher Krebskongress 2026

Large Language Models in der Onkologie: Potenzial trifft auf Infrastrukturprobleme

Auf dem Deutschen Krebskongress in Berlin diskutierten Experten aus München, Köln, Hamburg und Dresden den Einsatz von Large Language Models (LLMs) in der Krebsmedizin. Die Session zeigte beeindruckende technische Möglichkeiten, offenbarte aber auch fundamentale Schwächen in der deutschen Dateninfrastruktur.

Von Michelle Gresbek

Jedes Krankenhaus erzeugt pro Jahr etwa 50 Petabyte an Daten, 80% davon liegen unstrukturiert vor und werden nicht genutzt. Das berichtete PD Dr. Lisa Adams von der TU München. Genau hier setzen Large Language Models an. Die transformerbasierten neuronalen Netze können klinisches Wissen codieren, Patientenakten strukturiert extrahieren und bei Therapieentscheidungen unterstützen.

Die Forschungslandschaft entwickelt sich rasant. Ein systematisches Review vom August 2025 screente bereits 15.000 Artikel zu LLMs in der Onkologie. Bemerkenswert: 83% der Studien nutzten allgemeine Sprachmodelle wie ChatGPT oder Claude, nur 17% setzten onkologiespezifische Modelle ein.¹

Dieser Artikel könnte Sie auch interessieren

Artikel • Künstliche Intelligenz in der Inneren Medizin

Medizinische KI: Auftritt der ‚Dea ex machina‘

In der Welt des Theaters ist der ‚Deus ex machina‘, der Gott aus der Maschine, ein dramaturgischer Kniff, um scheinbar unlösbare Konflikte zu klären. Kann Künstliche Intelligenz (KI) für die Innere Medizin ebenfalls ein solcher universeller Problemlöser sein? Auf dem DGIM-Jahreskongress in Wiesbaden ging Dr. Isabella Wiest dem Potenzial – und den Limitationen – der KI-Helfer nach.

Adams verwies auf RAG-gestützte Ansätze, die LLMs mit aktueller Wissensbasis unterlegen. Einen weiteren Fortschritt sieht sie in agentischen Workflows, bei denen mehrere Sprachmodelle für unterschiedliche Aufgaben zusammenarbeiten. Eine Studie der Arbeitsgruppe um Prof. Jakob Nikolas Kather, publiziert in Nature Cancer², konnte die Genauigkeit von GPT-4 bei komplexen Krebsfällen deutlich steigern.

Deutschlands Daten-Dilemma

In ganz Deutschland gibt es keine einzige Klinik, die alle Patientendaten auf einer Plattform hat. Keine einzige Klinik. Man kann sich gar nicht vorstellen, was da verloren geht an Informationen
Thomas Elter

PD Dr. Thomas Elter von der Uniklinik Köln lieferte den Realitätscheck: Deutschland macht sich eine Illusion, wenn es glaubt, mit Big Data in der KI-Forschung mitspielen zu können. Die Datenbasis sei extrem fragmentiert, Datenschutzvorgaben machten große Forschungsprojekte nahezu unmöglich.

Elter illustrierte das Problem konkret: Das von Kather publizierte Nature-Paper arbeitete mit 20 Testfällen. Hätte sein Team Zugang zu chinesischen Dateninfrastrukturen gehabt, hätte er dasselbe Modell an 80.000 Echtfällen testen können. Das Ergebnis: 55% bis 60% der klinischen KI-Daten kommen aus China, ein Viertel aus den USA. Deutschland taucht in den Top 10 nicht auf.

„In ganz Deutschland gibt es keine einzige Klinik, die alle Patientendaten auf einer Plattform hat. Keine einzige Klinik“, so Elter. Sein Haus in Köln müsse 38 Tumorboards pro Woche abhalten. Nach dem Ende einer SAP-Lizenz im Januar mussten alle Befunde manuell kopiert werden. „Man kann sich gar nicht vorstellen, was da verloren geht an Informationen.“

Sein Lösungsvorschlag orientiert sich an historischen Erfolgsmodellen: In den 1980er und 1990er Jahren bildeten sich universitätsübergreifende Studiengruppen, bei denen Deutschland führend wurde. Elter plädierte für eine German AI Oncology Group nach diesem Vorbild und schlug spontan Prof. Kather als Chef vor.

KI-Prognose beim Pankreaskarzinom

François Schneider, Student im praktischen Jahr an der Charité Berlin, präsentierte Forschungsergebnisse aus der klinischen Anwendung, die kürzlich im European Journal of Cancer veröffentlicht wurden.³ Sein Team trainierte Machine-Learning-Modelle auf Daten von 1.040 Patienten mit Pankreaskarzinom. Die Modelle erreichten Vorhersagegenauigkeiten von 72% bis 79%.

Die KI berechnete szenarische Was-wäre-wenn-Analysen. Bei Patienten, die das Chemotherapeutikum Folfirinox erhalten hatten, zeigte das Modell, dass 43% von einer gemcitabinbasierten Therapie profitiert hätten. Als wichtigste Variablen identifizierte das System den Tumormarker CA19-9, den Entzündungsmarker CRP und die Tumorlokalisation. Geplant ist nun eine prospektive klinische Studie zur Validierung.

Chatbots empathischer als Ärzte

Dr. Martin Krusche vom Universitätsklinikum Hamburg-Eppendorf beleuchtete die Patientenperspektive. Eine deutschlandweite Befragung rheumatologischer Patienten Anfang 2025 ergab: Ein Viertel nutzt bereits KI-Systeme für Gesundheitsfragen, zwei Drittel können sich vorstellen, eine digitale Zweitmeinung einzuholen.⁴

Krusche testete ChatGPT-4 mit den 100 relevantesten Lupus-Fragen eines europäischen Expertenkonsortiums.⁵ Das Ergebnis überraschte: Das Sprachmodell war den Ärzten in der Qualität signifikant überlegen und wurde als empathischer wahrgenommen.

Praktische Anwendungen sieht Krusche bei der Vereinfachung von Arztbriefen. Ein Pilotprojekt am UKE erzeugt automatisch patientenfreundliche Versionen. 75% der Patienten bewerteten diese als verständlicher, 85% als sinnvoll. Der Aufwand: drei bis fünf Minuten pro Brief.

Allerdings warnte Krusche vor unkritischer Nutzung. Er zeigte den Fall eines 60-jährigen Mannes, der sich durch ChatGPT-Ernährungsempfehlungen einen Bromismus zuzog, eine seltene Vergiftung durch übermäßige Bromidaufnahme als Kochsalzersatz.⁶ Die Frage der Haftung bei Fehlempfehlungen bleibe ungeklärt.

Digitalisierung erhöht Stress (auf beiden Seiten)

Dr. Magdalena Wekenborg von der TU Dresden präsentierte eine unbequeme Wahrheit: Digitalisierung im Gesundheitswesen erhöht den Stress, statt zu entlasten. In einer 17-monatigen biopsychologischen Längsschnittstudie⁷ untersuchte sie zwei Universitätskliniken vor, während und nach Einführung eines digitalen Laborbuches. Das chronische Stresslevel stieg und blieb über ein Jahr erhöht.

Wekenborg misst Stress mittels Wearables und identifiziert kritische Momente in der Mensch-Maschine-Interaktion. Ihre These: Bisherige Forschung krankt daran, dass Systeme im Labor statt im echten klinischen Workflow evaluiert werden.

Ein weiterer Befund: Die Interaktion ist keine Einbahnstraße. Gestresste Ärzte stressen auch das LLM, mit messbaren Auswirkungen auf die Ausgabequalität. „Wenn ich jetzt eine Ärztin bin und frage mein Decision Support System, bin aber selbst total gestresst, stresse dadurch das System und verschlechtere dadurch meinen Output“, erklärte Wekenborg.

Diskussion: Datenschätze heben

Die anschließende Diskussion kreiste um ein zentrales Thema: Warum schafft Deutschland es nicht, seine Krebsregisterdaten und klinischen Daten zu vernetzen? Ein Teilnehmer vom Deutschen Krebsforschungszentrum berichtete, dass ein Projekt an unterschiedlichen Datenschutzvorgaben der Bundesländer gescheitert sei.

Prof. Kather ergänzte: Seine Arbeitsgruppe publiziert viel mit UK Biobank-Daten, habe es aber nie geschafft, vergleichbare deutsche Datenschätze zu heben. Bei der UK Biobank zahlt man 10.000 Euro und hat drei Jahre Zugriff auf hunderttausende Patientendaten. In Deutschland scheitert der Antrag beim Krebsregister an der Datensparsamkeit.

Ein Vertreter der Frauenselbsthilfe Bonn bot Unterstützung an: „Die Daten gehören Patienten, und die Patienten sind sehr dafür, dass diese Forschung erfolgt.“ Auch die Frage nach Prompt-Kompetenz wurde diskutiert. Wekenborgs Antwort: Nicht nur Prompt-Training sei nötig, sondern vor allem Output-Supervision.

Konsens herrschte in einem Punkt: KI ersetzt nicht die klinische Erfahrung, sondern erweitert sie. Die Session machte deutlich: Die Technologie ist reif. RAG-Systeme, agentische Workflows und Decision-Support-Tools funktionieren beeindruckend. Doch Deutschland kämpft mit hausgemachten Problemen. Der Vorschlag einer German AI Oncology Group wirkte wie ein Appell, die Konkurrenz zu vergessen und Ressourcen zu bündeln.

Quellen:

23.03.2026

Mehr zu den Themen:

Artikel • Deutscher Krebskongress 2026

Large Language Models in der Onkologie: Potenzial trifft auf Infrastrukturprobleme

Dieser Artikel könnte Sie auch interessieren

Artikel • Künstliche Intelligenz in der Inneren Medizin

Medizinische KI: Auftritt der ‚Dea ex machina‘

Deutschlands Daten-Dilemma

KI-Prognose beim Pankreaskarzinom

Chatbots empathischer als Ärzte

Digitalisierung erhöht Stress (auf beiden Seiten)

Diskussion: Datenschätze heben

Verwandte Artikel

News • Onkologie & IT

Daten aus Krebsregistern für die Nutzenbewertung nutzbar machen

Video • Medikationsmanagement

Auf digitalem Weg zur sicheren Krebsmedikation

News • Joint Imaging Platform (JIP)

Wenn die Daten nicht zum Algorithmus kommen...