Big Data im Darm Neue Ansätze zur Analyse biomedizinischer Mikrobiomdaten
Das Mikrobiom von gesunden und erkrankten Menschen ist ein Datenpool mit hohem Potenzial. Dabei geht es vor allem auch um das tiefe Verständnis der Interaktionen einer Vielzahl von Bakterienarten untereinander und mit den Darmzellen. Hier sind neue Ansätze der Datenanalyse gefragt.
Anbieter zum Thema

In den letzten Jahren ist durch eine Vielzahl empirischer Studien deutlich geworden, dass das Ensemble von Mikroorganismen im menschlichen Darm, ihre Wechselwirkungen untereinander und mit den Darmzellen, also das Mikrobiom, von großer klinischer Bedeutung sind.
Es sind (mit heutigen Methoden) etwa N = 500 verschiedene Taxa (auf der phylogenetischen Ebene der Gattung) in einem typischen Mikrobiom nachweisbar. Eine der aktuell wichtigsten öffentlichen Datenbanken zu Mikrobiomzusammensetzungen, das US-amerikanische Human Microbiome Project, enthält zum Beispiel über 2200 Mikrobiome aus Stuhlproben [1]. Zur Zeit werden zudem Mikrobiomzusammensetzungen aus einer Vielzahl klinischer Studien verfügbar, sodass die Rolle des Mikrobioms im klinischen Kontext immer fundierter untersucht werden kann.
Kombinatorisch bestehen damit N(N–1)/2 Interaktionsmöglichkeiten („jeder mit jedem“), die vorliegen oder fehlen und, falls sie vorliegen, zudem positiv (synergetisch) oder negativ (kompetitiv) sein können. Damit sind 3 hoch N(N-1)/2 verschiedene Netzwerke möglich, das wären bereits mehr Möglichkeiten als im Weltall Atome vermutet werden.
Auf einer etwas mikroskopischeren Ebene, nämlich im Metabolismus dieser Mikroorganismen, lassen sich die Interaktionen auf den Austausch von und den Wettbewerb um chemische Stoffe herunterbrechen. Diese Spezies spannen so ein riesiges Netzwerk vieler tausend biochemischer Reaktionen auf. Über Sekretion und Aufnahme chemischer Substanzen sind die Spezies untereinander und mit den sie umgebenden Darmzellen verzahnt. Eine kürzliche Studie [2] schätzt auf der Grundlage der aktuellen (immer noch unvollständigen) Kenntnis metabolischer Reaktionen etwa 2300 solche metabolische Wechselwirkungen als Fundament der beschriebenen mikrobiellen Interaktionsnetzwerke und etwa 700 metabolische Wechselwirkungen der Mikroorganismen mit den menschlichen Darmzellen.
Das Mikrobiom ist also ein komplexes, mit dem Darm verzahntes System, das von hoher Bedeutung für die Gesundheit ist. Und durch die Kombinatorik der Interaktionen, durch die aktuell explodierende Datengrundlage von Mikrobiomzusammensetzungen und durch sein metabolisches Fundament ist das Mikrobiom zudem ein Beispiel für „Big Data“ in der Biologie.
Automatische statistische Mikrobiomanalyse
Moderne Sequenziertechnik hat in der Biologie längst das Zählen und Zeichnen ersetzt – anstelle des Mikroskopierbildes treten 16S rRNA-Sequenzierdaten die mit Standardmethoden in Taxa klassifiziert werden.
Mit den so gewonnenen Häufigkeitstabellen erhält man ein Datenformat, bei dem jede einzelne Probe zu einem Abundanz- oder Häufigkeitsvektor führt. In biomedizinischen Datenbanken werden nun sehr viele dieser Dateneinträge gesammelt und können, bei medizinischen Daten systematisch anonymisiert, nach Phänotypen und weiteren Annotationen selektiert und extrahiert werden. Für jeden dieser Datensätze ergibt sich damit die Möglichkeit, die Auftretensmuster der Mikroorganismen systematisch zu studieren und zu analysieren.
Daraus ergeben sich allerdings einige statistische Fallstricke, denn die feine Auflösung der über 500 Gattungen ergibt bereits 499 x 500 / 2 Paare von Gattungen, deren gemeinsames Auftreten oder deren Verdrängung zu untersuchen wären. Es ist offensichtlich, dass hier eine enorme Zahl von Proben zu vergleichbaren Versuchsbedingungen genommen werden müsste, um über eine klassische Korrelationsanalyse zu signifikanten Ergebnissen zu gelangen. Zudem sind die Mikroorganismen in ihrer Häufigkeit sehr unterschiedlich und gerade die seltener vorkommenden Organismen („the rare biosphere“ [2]) sind medizinisch oft von besonderem Interesse.
(ID:44899305)