Artikel • Machine Learning in der Labormedizin
Möglichkeiten von ML bei der Analyse medizinischer Labordaten
Maschinelles Lernen (ML) kann dabei helfen, Labordaten effizient und präzise auszuwerten, um fundierte medizinische Entscheidungen zu treffen. Prof. Dr. Frank Klawonn zeigte in einem Vortrag auf der Medica in Düsseldorf verschiedene Möglichkeiten von ML auf, die zu Zeitersparnis und zur Steigerung der Produktivität führen können.
Artikel: Sonja Buske

© Sonja Buske
Klawonn, Leiter der Projektgruppe Biostatistik am Helmholtz-Zentrum für Infektionsforschung, stellte das CRISP-DM-Modell (Cross Industry Standard Process for Data Mining) vor, das als etablierter Rahmen für die Durchführung von Data-Mining-Projekten dient. Es strukturiert den Analyseprozess in mehreren Phasen: „Die Arbeit beginnt mit der Definition des Problems und der Aufbereitung der Daten, gefolgt von der Modellierung, der Evaluation und schließlich der Implementierung der Ergebnisse“, so Klawonn. Er unterstrich die Bedeutung eines methodischen Vorgehens wie CRISP-DM, um die Analyse von Labordaten effektiv und zielgerichtet zu gestalten.
Multimodales Lernen: Sorgfältige Datenvorbereitung nötig
Beim multimodalen Lernen werden unterschiedliche Arten von Daten, wie zum Beispiel klinische Messwerte, Bilddaten oder genetische Informationen, integriert. Ziel dieses Ansatzes ist es, komplexe Zusammenhänge zwischen den Datenquellen zu erkennen, um so fundiertere medizinische Erkenntnisse zu gewinnen. Klawonn wies jedoch darauf hin, dass diese Integration eine sorgfältige Datenvorbereitung erfordert, da die Daten oft unterschiedlich strukturiert und skaliert sind.
Ein wesentliches Element der Datenvorbereitung ist die Normalisierung. Klawonn verweist hierbei auf die Verwendung von zlog-Werten, beispielsweise für den Biomarker NT-proBNP, der bei der Diagnose von Herz-Kreislauf-Erkrankungen eine Rolle spielt. „Diese Methode der Normalisierung erlaubt es, altersbedingte Unterschiede in den Biomarker-Werten zu kompensieren, wodurch eine präzisere Interpretation der Ergebnisse möglich wird.“ Die Normalisierung trage dazu bei, klinische Aussagen unabhängig von demografischen Faktoren wie dem Alter zu treffen.
Effizienter programmieren mit ChatGPT
Das KI-gestützte große Sprachmodell (large language model; LLM) ChatGPT wird inzwischen in vielen Bereichen als Unterstützung für Datenanalysen und Programmieraufgaben genutzt. Klawonn zeigte auf, wie derartige moderne LLMs Forschern dabei helfen können, alltägliche Programmieraufgaben effizienter zu bewältigen. „ChatGPT wird genutzt, um einfache Skripte zu erstellen, Fragen zur Datenverarbeitung zu beantworten oder spezifische Abfragen für Datenanalysen zu generieren. Dadurch wird der manuelle Aufwand bei Routineaufgaben reduziert, was den Forschern mehr Zeit und Kapazität gibt, um sich auf komplexere und interpretative Aspekte ihrer Arbeit zu konzentrieren“, verdeutlichte der Experte.
ChatGPT wird somit zu einem wertvollen Werkzeug, das die Effizienz und die Zugänglichkeit maschineller Lerntechniken erheblich verbessert, auch für Forscher ohne tiefe Programmierkenntnisse
Frank Klawonn
Bei der Datenaufbereitung könne ChatGPT beispielsweise Anweisungen liefern, wie Daten aus verschiedenen Formaten konvertiert oder bereinigt werden können. Ebenso könne das Programm beim Verständnis und der Interpretation von Datenstrukturen helfen, indem es praktische Hilfestellungen bietet oder Muster in den Daten aufzeigt. „ChatGPT wird somit zu einem wertvollen Werkzeug, das die Effizienz und die Zugänglichkeit maschineller Lerntechniken erheblich verbessert, auch für Forscher ohne tiefe Programmierkenntnisse“, so Klawonn.
Er betonte, dass der Einsatz von ChatGPT besonders nützlich sei, wenn es darum geht, zeitaufwendige, aber repetitive Aufgaben zu automatisieren. „Diese Unterstützung ermöglicht es, sich stärker auf die eigentliche Forschung und Analyse zu konzentrieren, was letztlich zu einer Steigerung der Produktivität führt.“ Gleichzeitig wies er aber darauf hin, dass diese Tools keine menschliche Expertise ersetzen, sondern als Ergänzung gesehen werden sollten, um den Arbeitsprozess zu optimieren.
Letztendlich könnten moderne KI-Tools wie ChatGPT nicht nur die Arbeit mit Daten erleichtern, sondern auch dazu beitragen, ML und Datenanalysen zugänglicher zu machen. „Durch ihre intuitive Handhabung und die Fähigkeit, schnell Antworten oder Hilfestellungen zu liefern, können solche Tools dazu beitragen, die biomedizinische Forschung voranzutreiben.“
Einsatz in der Qualitätskontrolle
ML könne laut Klawonn auch in der Qualitätskontrolle Anwendung finden als Ergänzung zu bereits eingesetzten statistischen Verfahren. Er stellte in dem Zusammenhang die Methode der Assoziationsregeln vor, die dabei hilft, Muster in den Daten zu identifizieren, die stets gelten sollten. „Es gibt unzählige, meist triviale Regeln, die für Labordaten immer erfüllt sein müssen. Für labormedizinisches Personal wäre es ein enormer Aufwand, alle Regeln zu formulieren und aufgrund der häufigen Trivialität der Regeln würden viele Regeln einfach vergessen werden. Mit ML können solche Regeln aus den Daten gelernt und automatisiert überprüft werden.“
Abschließend betonte Klawonn, dass die Integration von Labordaten mit anderen Datenquellen nicht als bloßes Zusammenführen von Informationen verstanden werden sollte. „Vielmehr ist eine sorgfältige Vorbereitung und Normalisierung erforderlich, wie sie beispielsweise durch die Nutzung von zlog-Werten erreicht werden kann. Diese Herangehensweise ermöglicht es, aussagekräftige und vergleichbare Ergebnisse zu erzielen.“
Profil:
Prof. Dr. Frank Klawonn ist Leiter der Projektgruppe Biostatistik am Helmholtz-Zentrum für Infektionsforschung und lehrt an der Ostfalia Hochschule Statistik und ML. Er forscht zu statistischen und ML-Methoden in der Medizin, insbesondere der Labormedizin, und hat dieses Jahr gemeinsam mit einem Team den FAIR Data and Software Award Lower Saxony für die Software reflimR zur Berechnung und Überprüfung von Referenzintervallen erhalten.
16.04.2025