English China
Suchen

Genexpression

Zelluläre Genexpression statistisch unterstützt analysieren

Seite: 3/4

Firmen zum Thema

FISH-Kontrolle

Für die bisherigen Schlussfolgerungen muss noch gezeigt werden, dass die statistische Methode nicht nur für künstliche, perfekte Daten funktioniert, sondern auch für die realen Messungen. Die Schätzung könnte z. B. schiefgehen, wenn die Modellannahmen nicht zutreffen und aus irgendwelchen Gründen keine Lognormalverteilung vorliegt. Der Nachweis geschieht folgendermaßen: Mit Kontrollexperimenten kann die relative Häufigkeit p der beiden Zelltypen in einer Gewebeprobe bestimmt und mit den rechnerischen Ergebnissen verglichen werden. Hierzu wird die Fluoreszenz-in-situ-Hybridisierung (FISH) verwendet, die es erlaubt, Zellen zu identifizieren, in denen besonders viel mRNA eines bestimmten Gens vorliegt, in denen das entsprechende Gen also hochreguliert ist (s. Abb. 4). FISH ist sehr aufwändig und teuer. Daher bietet es keine Alternative zum statistischen Verfahren. Es kann in begrenztem Umfang durchgeführt werden und dient dann zur Überprüfung der rechnerischen Ergebnisse. Wie Abbildung 3 zeigt, ist die Übereinstimmung bei den vorliegenden Daten groß. Aus der Verifizierung der relativen Häufigkeit p ist zu schließen, dass die statistische Methode auch die weiteren Parameter μ1, μ2, σ1 und σ2 verlässlich schätzt.

Mehr ist mehr

Es bleibt die Frage, ob und inwiefern die Analyse von gemischten Messungen der Einzelzellanalyse überlegen ist, wenn man von den technischen Schwierigkeiten der Einzelzellmessungen absieht. Einzelzelldaten haben den Vorteil, dass sie unmittelbare Infos zu einer einzigen Zelle liefern, während die Infos in den aggregierten Messungen vermischt sind. Andererseits enthalten die aggregierten Messungen die Information zu viel mehr Zellen, und wie fast immer in der Statistik ist es von Vorteil, viel zu erfassen. Angenommen, einer der beiden Zelltypen kommt nur in 5 % aller Zellen vor, und es liegen 16 Messungen vor. Im Fall der Einzelzelldaten würde man dann 16 Zellen betrachten, von denen voraussichtlich zwischen 0 und 2 Zellen von diesem Zelltyp wären (durchschnittlich 0,8 Zellen). Hieraus lässt sich nicht viel ableiten. Im Fall der aggregierten Messungen dagegen würde man 160 Zellen analysieren, davon wahrscheinlich zwischen 4 und 13 (durchschnittlich 8) vom besagten Zelltyp.

Bildergalerie

Um den Unterschied genauer zu quantifizieren, werden noch einmal künstliche Daten zu Hilfe genommen: Man simuliert 100 Datensätze, in denen jede Messung auf einer einzelnen Zelle beruht, und 100 Datensätze, bei denen jeweils zehn Zellen aggregiert werden. Für jeden Datensatz werden alle Parameter geschätzt und die durchschnittliche Abweichung von den wahren Werten betrachtet. Die aggregierten Daten sind dabei den Einzelzelldaten weit überlegen. Der Unterschied ist umso deutlicher, je geringer der Anteil der kleineren Population ist. Das hier beschriebene Stochastic Profiling mit anschließender Maximum-Likelihood-Schätzung liefert also mit weniger Aufwand verlässlichere Ergebnisse.

(ID:42648987)