"Kipoi"-Plattform

Intelligente Algorithmen für die Genomforschung

Um herauszufinden, welche Gene für Krankheiten wie Krebs oder Diabetes verantwortlich sind, wird heute häufig auf Methoden des Maschinellen Lernens zurückgegriffen.

Quelle: Shutterstock/ktsdesign

Damit die klinische Forschung Zugang zu den aktuellsten Algorithmen erhält, hat Prof. Julien Gagneur von der Technischen Universität München (TUM) in Zusammenarbeit mit Wissenschaftlern anderer Universitäten und Forschungsinstitute die Open-Access-Plattform „Kipoi“ aufgebaut.

Obwohl die Bedeutung von Methoden des Maschinellen Lernens in der Genomforschung in den letzten Jahren stetig gewachsen ist, mussten Forscher häufig auf veraltete Software zurückgreifen. Für die klinische Forschung waren die aktuellsten Modelle meist nicht zugänglich, da diese auf nichtöffentlichen Servern gespeichert wurden. Das soll sich mit einer neuen kostenlosen Open-Access-Plattform ändern: Kipoi ermöglicht den einfachen Austausch von Machine-Learning-Modellen im Bereich der Genomforschung. Geschaffen wurde die Plattform von Julien Gagneur, Assistenzprofessor für Computational Biology an der TUM in Zusammenarbeit mit Forschern der University of Cambridge, der Stanford University, des European Bioinformatics Institute (EMBL-EBI) und des European Molecular Biology Laboratory (EMBL).

Trainierte Modelle offen verfügbar

„Was Kipoi besonders macht, ist dass man hier frei zugänglich bereits trainierte Machine-Learning-Modelle finden kann“, sagt Julien Gagneur. „Die Algorithmen, die wir hier bereitstellen, haben schon die wichtigsten Daten als Input bekommen und daran gelernt. Sie sind also sofort einsatzbereit, da der zeitraubende Prozess, sie auf Daten anzuwenden, bereits abgeschlossen ist,“ sagt Anshul Kundaje, Assistenzprofessor in Stanford. Mehr als 2.000 trainierte Modelle sind auf Kipoi momentan frei zugänglich. Wie die neue Plattform den Wissensaustausch in der Genomik-Community beschleunigen und damit die Genomforschung als Ganzes voranbringen wird, zeigen die Forscher in einer aktuell in Nature Biotechnology veröffentlichten Studie.

Schnelle Algorithmen und einfache Bedienung

Wir hoffen, dass in Zukunft mehr Forscher ihre Modelle in unsere Plattform einbringen werden

Oliver Stegle

Kipoi vereinfacht den Zugang zu bereits trainierten Modellen und ermöglicht es Forschern dadurch, das sogenannte Transferlernen durchzuführen: Ein Modell, das bereits mit einem bestimmten Datensatz trainiert wurde, kann eine ähnliche Aufgabe schneller lernen. Zudem vereinfacht Kipoi den Prozess der Dateneingabe in die dort gespeicherten Modelle: Durch standardisierte Dateiformate und Software-Frameworks beschränkt sich die Installation und Ausführung eines Modells auf drei einfache Befehle. Die Plattform ist so auch für diejenigen leicht zu bedienen, die bisher keine Erfahrung mit Maschinellem Lernen hatten.

Zum Verständnis einzelner Genome

Da Kipoi speziell auf Modelle ausgerichtet ist, die Genotyp und Phänotyp miteinander verknüpfen, wird es mithilfe der neuen Plattform einfacher werden, genetische Ursachen für Krankheiten ausfindig zu machen: „Die Deep-Learning-Modelle, die wir mit Kipoi zur Verfügung stellen, basieren auf massiven genomischen Datensätzen,“ sagt Julien Gagneur. „Dies bietet sehr spannende Möglichkeiten, einzelne Genome zu verstehen. Zum Beispiel genetische Varianten, die Krankheiten verursachen, zu identifizieren oder Mutationen in Tumoren zu interpretieren.“

Wie groß der Beitrag der Plattform für die Genomforschung sein wird, hängt allerdings auch von der Genomik-Community ab. „Wir hoffen, dass in Zukunft mehr Forscher ihre Modelle in unsere Plattform einbringen werden,“ sagt Oliver Stegle, Teamleiter am EMBL. „Nur so können wir die Genomik-Analyse zugänglich gestalten und der Community eine breitere Palette an prädiktiven maschinellen Lernwerkzeugen zur Verfügung stellen.“


Quelle: Technische Universität München

03.06.2019

Mehr aktuelle Beiträge lesen

Verwandte Artikel

Photo

Künstliche Intelligenz

Maschinelles Lernen macht Proteomikforschung leistungsfähiger

Mit dem Einsatz von künstlicher Intelligenz ist es Forschenden der Technischen Universität München (TUM) gelungen, die massenhafte Analyse von Eiweißen aus beliebigen Organismen deutlich…

Photo

Technik in den Genen

Was KI in der Genomforschung leisten kann (und was nicht)

Die Entschlüsselung des menschlichen Erbguts gibt noch immer Rätsel auf. Künstliche Intelligenz könnte helfen, diese zu lösen. Neue therapeutische Ansätze für schwerwiegende Krankheiten…

Photo

Diagnose per Computer

Machine Learning enttarnt gefährliche Erreger

Per Computer erkennen, ob ein neu auftretender Salmonellenstamm eher eine gefährliche Infektion in der menschlichen Blutbahn oder eine Lebensmittelvergiftung verursacht – das kann ein neu…

Verwandte Produkte

Eppendorf - Mastercycler nexus X2

Research use only (RUO)

Eppendorf - Mastercycler nexus X2

Eppendorf AG
Agena Bioscience - MassARRAY Colon Panel

Amplification/Detection

Agena Bioscience - MassARRAY Colon Panel

Agena Bioscience GmbH
Agfa HealtCare – Dose

Dose Management Systems

Agfa HealtCare – Dose

Agfa HealthCare
Agfa HealtCare – Enterprise Imaging

Mobile RIS/PACS Viewer

Agfa HealtCare – Enterprise Imaging

Agfa HealthCare
Agfa HealthCare – DR 14e detector

DR Retrofit

Agfa HealthCare – DR 14e detector

Agfa HealthCare
Agfa HealthCare – DR 14s detector

DR Retrofit

Agfa HealthCare – DR 14s detector

Agfa HealthCare