Quelle: Shutterstock/kentoh

Helmholtz-Zentrum

Künstliche Intelligenz soll bei Therapieforschung helfen

Forschende des DZNE und des Helmholtz-Zentrums für Informationssicherheit (CISPA) wollen mit Hilfe „künstlicher Intelligenz“ die Weitergabe von Genomdaten für Forschungszwecke unter den strengen Auflagen des Datenschutzes erleichtern. Ziel ist die Generierung „virtueller Kohortendaten“, die zentrale Informationen realer Probanden enthalten, jedoch keine Rückschlüsse auf den Einzelnen zulassen.

Das Projekt mit dem Namen „PRO-GENE-GEN“ hat ein Gesamtvolumen von rund 360.000 Euro. Es wird in den nächsten drei Jahren von DZNE, CISPA und der Helmholtz-Gemeinschaft finanziert.

Für die Therapieforschung ist das menschliche Erbgut ein wahrer Fundus. Denn hier können Mutationen angelegt sein, die bestimmte Erkrankungen begünstigen oder gar direkt auslösen. Neben den Genomdaten im strengen Sinne ist auch das „Transkriptom“ von Interesse, da es Informationen darüber enthält, welche Abschnitte des Erbguts tatsächlich aktiv sind – ein Muster, das sich krankheitsbedingt verändern kann. Wissenschaftliche Studien mit Personenbeteiligung sind allerdings enorm aufwändig. Deshalb besteht großes Interesse daran, die Daten solcher Untersuchungen allgemein zugänglich zu machen: etwa um die Nachprüfbarkeit von Forschungsergebnissen zu gewährleisten oder auch um sie Forschungsprojekten bereitzustellen, die sich erst im Nachhinein ergeben haben. „Die Medizinforschung ist heutzutage datengetrieben. Sogenanntes Big Data gilt als ein Schlüssel für die Entwicklung personalisierter Therapien, die besser als herkömmliche Behandlungen passgenau auf jeden Einzelnen zugeschnitten sind“, erläutert Dr. Matthias Becker, Bioinformatiker am DZNE-Standort Bonn.

Schutz der Privatsphäre

Eine Weitergabe von Studiendaten sei bislang jedoch nur eingeschränkt möglich, so Becker: „Der Umgang unterliegt strengen gesetzlichen Regelungen, denn die Daten sind personenbezogen. Es gibt zwar Mechanismen zur Wahrung der Privatsphäre, doch diese sind entweder mit erheblichem Aufwand verbunden oder in der Praxis nicht umsetzbar. Speziell Genomdaten können deshalb nicht im notwendigen Maße geteilt werden, um den wissenschaftlichen Fortschritt zu sichern.“

Das Forschungsteam von DZNE und CISPA will deshalb Methoden entwickeln, die eine bessere Verbreitung solcher Informationen ermöglichen. „Auf der Grundlage echter Genomdaten möchten wir synthetische Datensätze erstellen, die Schlüsselinformationen der ursprünglichen Daten beinhalten und gleichzeitig die Privatsphäre vollumfänglich absichern. Es geht gewissermaßen um ein datenschutzkonformes Abbild. Ähnlich einer Zeugenaussage, bei der die Stimme verfremdet wird, um die Identität zu schützen“, sagt Becker. „Dadurch lassen sich große Datensätze öffentlich zugänglich machen, was für Fortschritte in der Medizin enorm wichtig ist.“

Dieser Artikel könnte Sie auch interessieren

Photo

Künstliche Intelligenz in der Medizin

Studie zeigt großes Potenzial von KI-Kooperation

Künstliche Intelligenz (KI) wird in der Medizin immer öfter zur Unterstützung menschlicher Expertise eingesetzt. Das Potenzial dieser Anwendungen sowie mögliche Gefahren beim Zusammenspiel zwischen menschlicher und künstlicher Intelligenz sind jedoch noch nicht zur Gänze erforscht. Immer wieder tauchen Befürchtungen auf, dass sich in Zukunft, sobald KI in ausreichender Qualität zur…

Lernfähige Algorithmen

Idealerweise sind die synthetischen Daten nicht nur auf eine Fragestellung zugeschnitten, sondern möglichst allgemein verwendbar.

Matthias Becker

Die Forscher setzen zunächst bei bestimmten Fragestellungen an. „Es kann zum Beispiel um das Muster der Genexpression gehen. Also darum, welche Gene bei einer bestimmten Erkrankung aktiv sind“, so Prof. Mario Fritz, Wissenschaftler am CISPA, der das Forschungsvorhaben gemeinsam mit Becker koordiniert. „Wir möchten lernfähige Algorithmen darauf trainieren, solche Muster in Genomdaten zu erkennen. Das ist eine Herausforderung, denn schon die Daten eines einzelnen Genoms sind äußerst komplex. Und man trainiert die Algorithmen anhand der Daten von Hunderten oder gar Tausenden von Personen. Hierin liegen die Stärken des maschinellen Lernens.“

Mit Hilfe einer Methode, die sich „privatsphärenkonforme, generative Modellierung“ nennt, wollen die Forschenden zudem Computermodelle entwickeln, welche die Quintessenz solcher Datenmuster nachbilden und zugleich den Personenbezug ausblenden. „Man kann sich das vielleicht wie einen intelligenten Filter vorstellen“, so Fritz. Auf diese Weise sollen reale Daten in synthetische überführt werden. „Gehen wir etwa von den Daten von 1000 Personen aus, dann stehen am Ende eine ähnlich große Anzahl synthetischer Datensätze. Das nennen wir virtuelle Kohorte. Deren Daten können genauso wie reale Daten mit gängigen Werkzeugen der Genforschung analysiert werden ohne jedoch die Privatsphäre der realen Personen zu verletzen.“

Informationsverluste sind bei der Umwandlung von realen in synthetische Daten nicht auszuschließen. Wie bedeutsam diese sind, will das Team von DZNE und CISPA untersuchen und quantifizieren. „Es geht ja gerade nicht um eine vollständige Kopie“, sagt Becker. „Idealerweise sind die synthetischen Daten nicht nur auf eine Fragestellung zugeschnitten, sondern möglichst allgemein verwendbar. Etwa für die Demenzforschung, Krebsforschung oder allgemein zur Erforschung von Volkskrankheiten, bei denen die Genetik von Bedeutung ist. Letztlich geht es darum, Möglichkeiten des Datenaustauschs zu schaffen, die innerhalb der Wissenschaft breitflächig genutzt werden können.“

Das Projekt „PRO-GENE-GEN“ ist im Rahmen des „Helmholtz Medical Security, Privacy, and AI Research Centers“ (HMSP) entstanden. Das HMSP (Web: hmsp.center) ist ein Zusammenschluss von sechs Helmholtz-Zentren – einschließlich CISPA und DZNE - die entscheidende Herausforderungen im Bereich der Gesundheitsforschung mit Hinblick auf Sicherheit, Privatsphäre und Künstliche Intelligenz angehen.

Quelle: Deutsche Zentrum für Neurodegenerative Erkrankungen e.V. (DZNE) 

10.07.2020

Mehr zu den Themen:
Mehr aktuelle Beiträge lesen

Verwandte Artikel

Photo

Datenverarbeitung und KI

Hochleistungs-Rechner für die Covid-Forschung

Die Erforschung von Covid-19 ist mit der Analyse und Verarbeitung enormer Datenmengen verbunden, etwa bei der Genom-Sequenzierung zur Identifizierung von Hochrisikopatienten und Entwicklung gezielter…

Photo

Autonome Gehhilfe

Hightech-Rollator findet seinen Weg von selbst

Forscher der Hokkaido University haben einen autonomen Hightech-Rollator für Behinderte in Krankenhäusern oder Pflegeeinrichtungen entwickelt, der sich dank eines speziellen Senders anfordern…

Photo

Blutkrebs

Maschinelles Lernen hilft bei der Leukämie-Diagnose

Forschende der Universität Bonn zeigen, wie die Künstliche Intelligenz die Auswertung von Blutanalysedaten verbessert.

Verwandte Produkte

Agfa - Smart XR

Accessories/ Complementary Systems

Agfa - Smart XR

Agfa HealthCare
Canon - Advanced Intelligent Clear-IQ Engine for CT

Artificial Intelligence

Canon - Advanced Intelligent Clear-IQ Engine for CT

Canon Medical Systems Europe B.V.
Canon – Advanced intelligent Clear-IQ Engine for MR

Artificial Intelligence

Canon – Advanced intelligent Clear-IQ Engine for MR

Canon Medical Systems Europe B.V.
Canon - Aquilion Exceed LB

Oncology CT

Canon - Aquilion Exceed LB

Canon Medical Systems Europe B.V.
Canon - HIT Automation Platform

Artificial Intelligence

Canon - HIT Automation Platform

Canon Medical Systems Europe B.V.
Canon Medical - CT Scan Unit

Mobile CT Solutions

Canon Medical - CT Scan Unit

Canon Medical Systems Europe B.V.
Newsletter abonnieren