Suchen

Big Data im Darm

Neue Ansätze zur Analyse biomedizinischer Mikrobiomdaten

Seite: 2/3

Firmen zum Thema

Um ein stärkeres statistisches Signal zu erhalten, können die Mikroorganismen aber auf einem höheren taxonomischen Level zusammengefasst werden, etwa Familie, Ordnung oder Stamm (Phylum). Jeder Vergröberungsschritt führt dabei zwar zu einem statistisch stärkeren Signal, jedoch unter Verlust, die Ergebnisse funktionell feiner zu interpretieren. Zum Beispiel würde das bekannte Bakterium Escherichia coli auf dieser Ebene mit anderen Enterobakterien zusammen als ein Taxon betrachtet, die möglicherweise vollkommen andere metabolische Nischen besetzen. Klinisch ist aber von besonderem Interesse, welche Substanzen von den Mikroorganismen im Darm abgebaut werden und welche Stoffe dabei erzeugt werden, die wiederum für den Wirtsorganismus von Bedeutung sind.

Geht man auf die gröbste Ebene, die in solchen Daten typischerweise zur Verfügung steht, das Phylum, findet man daher aus einer Korrelationsanalyse zunächst eine starke Antikorrelation von Bacteriodetes und Firmicutes, was nicht verwunderlich ist, da diese bis zu 90 Prozent der Darmflora bevölkern und alle anderen Stämme fast sicher an den Rand der Beobachtbarkeit drücken. Unter den anderen Bakterienstämmen sind die Korrelationen dann bereits so wenig signifikant, dass die Grenzen dieser statistischen Methodik offensichtlich werden. Da gerade die seltenen Bakterien von besonderem Interesse sind, ist es also eine besondere Herausforderung, aus dieser Art von Daten trotzdem Informationen abzuleiten. Dieser Aufgabenstellung widmet sich unsere Analysemethode.

Bildergalerie

Eine Schlüsselfrage ist, welche Interaktionen (aus der großen Zahl der Möglichkeiten) in den experimentellen Daten tatsächlich wirksam werden. Diese Frage wurde in einer kürzlich erschienenen Arbeit [3] der Autoren adressiert.

Boole, Informationstheorie und dynamische Netzwerke

Im Gegensatz zu einer Vielzahl von Analysen zu mikrobiellen Interaktionen wird hier nur die Information über das Fehlen oder Vorhandensein eines bestimmten Taxons in einer Probe verwendet. Auf diese Weise liegt der Schwerpunkt der Datenanalyse nicht auf den (starken) Fluktuationen der sehr häufigen Taxa, sondern auf den großen Unterschieden in der Zusammensetzung des individuellen Mikrobioms – und dabei besonders auf den Taxa mit niedriger Häufigkeit.

Es wird also die Eigenschaft einer binären Matrix ausgewertet, in der die Spalten die Taxa und die Zeilen die Proben repräsentieren. Konkret wird gemessen, ob sich Paare binärer Vektoren (Spalten der Ma­trix) für zwei Taxa unter Kombination vereinfachen.

Führt die logische Kombination der Vektoren über ein logisches UND zu einem einfachen Vektor mit unerwartet vielen Nullen, scheint es eine negative Interaktion zwischen den beiden Taxa zu geben. Enthält der resultierende Vektor vereinfacht viele Einsen, so spricht dies für eine positive Interaktion. Das präzise Fundament für diese Betrachtungsweise wird in [3] gelegt. Abbildung 2 illustriert dieses Verfahren an einem Beispiel. Der zugehörige Analysealgorithmus, ESABO (die Abkürzung steht für Entropy Shift of Abundance Vectors under Boolean Operations, also Entropieänderung von Abundanzvektoren unter Booleschen Operationen) wird in dem ergänzenden Material zu [3] zur Verfügung gestellt.

(ID:44899305)