Artikel • Große Datenmengen, große Herausforderungen
Big Data: Wie erziehe ich meinen Algorithmus?
„Algorithmen sind wie kleine Kinder, denen man erst alles beibringen muss“, mit dieser Analogie hatte Dr. Daniel Pinto dos Santos die Aufmerksamkeit seiner Zuschauer auf dem ECR 2018 direkt auf seiner Seite. Ähnlich wie gute Pädagogen Strategien brauchen, um den Nachwuchs aufs Leben vorzubereiten, müssen auch Radiologen einige Vorarbeit leisten, damit der Computer gut für seine Aufgabe gerüstet ist – die automatisierte Auswertung von Bilddaten.
Bericht: Wolfgang Behrends
Denn schon beim Training kann man eine Menge falsch machen, warnt der Experte von der Machine Learning and Data Science Group der Uniklinik Köln. „Es reicht nicht aus, den Algorithmus einfach mit möglichst vielen Daten zu füttern. Eine große Menge an Trainingsdaten ist zwar wichtig, allerdings braucht eine AI, die spezifische Aufgaben erfüllen soll, auch hochspezifische Daten.“ Genau an dieser Stelle liegt ein wesentliches Problem, denn die Radiologie generiert zwar große Datenmengen, diese sind jedoch meist schlecht strukturiert und folgen keinen einheitlichen Standards. Ein wichtiger Schritt in die richtige Richtung ist die digitale Verfügbarkeit der Daten, doch die sinnvolle Aufarbeitung – etwa durch Verknüpfung mit den zugehörigen DICOM-Daten – bedeutet noch viel Arbeit.
Was Radiologen vom Labor lernen können
Die strukturierte Befundung ist viel leichter verständlich, sowohl für Menschen als auch für Maschinen
Daniel Pinto dos Santos
Als eines der heißesten Themen der Radiologie wird die AI-Diagnostik gehandelt, doch auf dem Weg zu brauchbaren Ergebnissen steht sich das Fach oft selbst im Weg, gibt Pinto dos Santos zu bedenken: „Befundberichte bestehen aus langen Texten, häufig sind die Struktur und die Bezeichnungen nicht einheitlich – ein Textmining-Tool kann diese Dokumente zwar auswerten, aber viele Informationen bleiben dabei auf der Strecke.“ Der AI-Experte empfiehlt den Blick ins Labor: Dort ist die strukturierte Befundung deutlich etablierter, die Laborberichte sind dadurch kurz und enthalten alle wesentlichen Werte in einem Format, das auch für Maschinen leicht auszulesen ist.
Weitere Vorteile dieser Auswertungsform sind ein hohes Maß an Verständlichkeit, auch über Sprachgrenzen hinweg. „Ein ausführlicher Radiologiebefund kann einen Leser mit anderer Muttersprache schnell an seine Grenzen bringen. Die strukturierte Befundung dagegen ist viel leichter verständlich, sowohl für Menschen als auch für Maschinen.“ Letztere profitieren besonders von einheitlichen IHE-Standards wie MRRT (Management of Radiology Report Templates). Nicht zuletzt bedeutet die Reduzierung auch eine erhebliche Platzersparnis – im Kontext von Big Data ein wesentlicher Faktor.
Ein Hemmschuh ist jedoch bislang die mangelnde Unterstützung der bestehenden Standards durch die Industrie, beschließt Pinto dos Santos seinen Vortrag mit dem Appell: „Wir müssen auf die Hersteller zugehen und mit ihnen zusammen praktische Lösungen erarbeiten.“
Session: D. Pinto dos Santos: Big data and structured reporting, ECR 2018
06.03.2018