Worldwide China

Software mit neuem Ansatz

Maschinelles Lernen für die Genexpressionsanalyse

| Redakteur: Marc Platthaus

Visualisierung von Genexpressionsmustern muriner Gehirnzellen mit Scanpy.
Bildergalerie: 1 Bild
Visualisierung von Genexpressionsmustern muriner Gehirnzellen mit Scanpy. (Bild: Helmholtz Zentrum München)

Nachdem das Human-Genom-Projekt sich zum Ziel gesetzt hatte, das gesamte menschliche Genom zu sequenzieren, hat ein internationales Wissenschaftler-Team nun ein noch ehrgeizigeres Forschungsprojekt gestartet: Im Human Cell Atlas wollen sie die Genaktivitäten aller menschlichen Zellen erfassen. Voraussetzung hierfür sind optimierte Software-Systeme. Am Helmholtz Zentrum München wurde nun mit Scanpy eine neuartige Software entwickelt, die bei Fragestellungen zur Computational Biology wie dem Human Cell Atlas entscheidende Dienste leisten kann.

Oberschleißheim – Die Software mit dem Namen Scanpy ist beispielsweise ein Kandidat für die Auswertung des Human Cell Atlas Projekts. „Es geht um die Analyse von Genexpressionsdaten zahlreicher einzelner Zellen“, erklärt Erstautor Alex Wolf vom Institute of Computational Biology (ICB) des Helmholtz Zentrums München. Er hat Scanpy entwickelt, gemeinsam mit seinem Kollegen Philipp Angerer in der Machine Learning Gruppe von Institutsdirektor Prof. Dr. Dr. Fabian Theis, der neben seiner Position am Helmholtz Zentrum auch Professor für Mathematische Modelle biologischer Systeme an der TU München ist. „Die neue technische Möglichkeiten generieren um Größenordnungen mehr Daten mit dementsprechend höherer Information“, schildert Theis. „Allerdings war die historisch gewachsene Software-Infrastruktur zur Genexpressionsanalyse nicht auf die neuen Herausforderungen ausgelegt.“ Entsprechend groß sei hier der Bedarf nach neuen Analysemethoden.

Im Rennen für den Human Cell Atlas

Auch ein großes internationales Forschungsvorhaben könnte Theis zufolge von der Software profitieren. Unter dem Namen ‚Human Cell Atlas‘ tragen zahlreiche internationale Wissenschaftler eine Referenzdatenbank zusammen, in der die Genaktivität aller menschlichen Zelltypen erfasst ist. „Für dieses Projekt oder auch bei der immer häufiger werdenden Zusammenlegung von bestehenden Datensätzen ist es wichtig, eine skalierbare Software zu haben“, so Theis. Entsprechend sei Scanpy aktuell in der Auswahl für die Analysesoftware des Human Cell Atlas.

„Mit Scanpy publizieren wir die erste Software, die eine umfängliche Analyse großer Genexpressionsdatensätze mit einem breiten Spektrum aus Methoden des maschinellen Lernens und Statistik erlaubt“, beschreibt Alex Wolf den Fortschritt. „Bereits jetzt wird die Software in diversen Gruppen weltweit eingesetzt, insbesondere auch am Broad Institute von Harvard und dem Massachusetts Institute of Technology.“

In Programmiersprache Python geschrieben

Technologisch beschreitet die Anwendung neue Wege: Während entsprechende Biostatistik-Software traditionell in der Programmiersprache R geschrieben wurde, basiert Scanpy auf der Sprache Python, die die Machine Learning Community dominiert. Neu ist zudem, dass Graph-basierte Algorithmen das Herz von Scanpy bilden. Anstatt Zellen wie bisher üblich als Punkte im Koordinatensystem des Genexpressionsraums zu betrachten, verwenden die Algorithmen ein graphartiges Koordinatensystem. Das heißt, anstatt eine Zelle mit dem Expressionswert einiger Tausend Gene zu charakterisieren, wird sie einfach durch die Angabe ihrer nächsten Nachbarn charakterisiert – vergleichbar mit Verbindungen in sozialen Netzwerken. Wenn es zum Beispiel um die Identifikation von Zelltypen geht, verwendet Scanpy also die gleichen Algorithmen wie Facebook zur Identifikation von Communities.

Originalpublikation: Wolf, A. et al. (2018): Scanpy: large-scale single-cell gene expression data analysis. Genome Biology, DOI: 10.1186/s13059-017-1382-0

Kommentare werden geladen....

Kommentar zu diesem Artikel abgeben

Der Kommentar wird durch einen Redakteur geprüft und in Kürze freigeschaltet.

  1. Avatar
    Avatar
    Bearbeitet von am
    Bearbeitet von am
    1. Avatar
      Avatar
      Bearbeitet von am
      Bearbeitet von am

Kommentare werden geladen....

Kommentar melden

Melden Sie diesen Kommentar, wenn dieser nicht den Richtlinien entspricht.

Kommentar Freigeben

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Freigabe entfernen

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Infos finden Sie unter www.mycontentfactory.de (ID: 45137502 / Bio- & Pharmaanalytik)