Suchen

Genexpression Zelluläre Genexpression statistisch unterstützt analysieren

| Autor/ Redakteur: Christiane Fuchs* / Dr. Ilka Ottleben

Der Schlüssel zur Funktionsweise unserer Zellen liegt in ihrer Genexpression. Experimentelle Einzelzellanalysen sind aber aufwändig und teuer. Mit Tricks aus der Statistik geht’s schnell und zuverlässig. Mögliche Anwendungen liegen z.B. in der Krebsforschung.

Firmen zum Thema

Abb. 1: Herangehensweisen für die Schätzung von Zellheterogenitäten: A) Analyse von Einzelzellmessungen. Solche Daten sind teuer und unterliegen großem Messfehler. Daher sind sie hier nicht sinnvoll. B) Vorsortierung der Zellen nach Zelltypen und anschließende Microarray-Messung für eine Menge gleicher Zellen. Im hier betrachteten Fall ist die Vorsortierung wegen der identischen Morphologie nicht möglich. C) Stochastic Profiling: Für eine zufällig ausgewählte Menge von Zellen wird die Gesamtexpression gemessen und diese per Maximum Likelihood analysiert.
Abb. 1: Herangehensweisen für die Schätzung von Zellheterogenitäten: A) Analyse von Einzelzellmessungen. Solche Daten sind teuer und unterliegen großem Messfehler. Daher sind sie hier nicht sinnvoll. B) Vorsortierung der Zellen nach Zelltypen und anschließende Microarray-Messung für eine Menge gleicher Zellen. Im hier betrachteten Fall ist die Vorsortierung wegen der identischen Morphologie nicht möglich. C) Stochastic Profiling: Für eine zufällig ausgewählte Menge von Zellen wird die Gesamtexpression gemessen und diese per Maximum Likelihood analysiert.
(Bild: Helmholtz Zentrum München)

Jeder Mensch ist mit einem individuellen, einmaligen Satz von Genen ausgestattet, und jede Zelle im menschlichen Körper enthält genau diesen gleichen Satz von Genen. Dennoch gibt es eine große Vielfalt an Zellen, z. B. Nervenzellen, Hautzellen und Muskelzellen. Die Heterogenität der Zellen rührt daher, dass in verschiedenen Gewebearten verschiedene Gene aktiv sind. Aktive Gene werden in RNA umgeschrieben (Transkription) und dann in Proteine übersetzt (Translation). Man sagt, diese Gene werden exprimiert. Solche Genexpression kann gemessen werden. Microarrays liefern beispielsweise die relative Menge an messenger RNA (mRNA).

Hautzellen und Muskelzellen haben also unterschiedliche Expressionsmuster. Sie können allerdings auch allein aufgrund ihrer Morphologie, also ihres Aussehens, unterschieden werden. Das gleiche gilt für gesunde Zellen und Krebszellen der gleichen Gewebeart: Krebszellen sind oft größer und haben einen größeren Zellkern als ihre gesunden Nachbarn. Sie unterscheiden sich außerdem in ihrem Genexpressionsmuster, und genau das ist auch der Grund dafür, warum eine gesunde Zelle zur Krebszelle wurde.

Bildergalerie

Eine kranke Zelle verändert aber nicht schlagartig ihr Aussehen. Zunächst ändert sich die Aktivität der Gene, und erst in der Folge kommt es zum veränderten Erscheinungsbild. In diesem Zwischenstadium unterscheiden sich gesunde und kranke Zellen in ihrer Genexpression, unter dem Mikroskop sehen sie aber identisch aus. Für die Krebsforschung ist es wichtig, die Eigenschaften der zwei Zellarten zu diesem Zeitpunkt zu kennen.

Die Problemstellung lautet also, für eine Menge von gleich aussehenden, aber heterogenen Zellen zwei Zelltypen anhand ihrer Genexpression zu identifizieren. Die zwei Zelltypen unterscheiden sich darin, dass ein bestimmtes Gen in einem der Typen hochreguliert ist, d.h. verstärkt transkribiert wird, und im anderen Zelltyp nicht.

Die Mischung macht’s

Die möglichen Herangehensweisen für diese Fragestellung sind in Abbildung 1 beschrieben. Der Ansatz, der hier vorgestellt wird, nennt sich Stochastic Profiling: Aus jeder Gewebeprobe wird zufällig eine kleine Anzahl von Zellen entnommen und hiervon die Summe der Einzelexpressionen gemessen (s. Abb. 1). Das hat den Vorteil, dass mehr genetisches Startmaterial vorhanden ist, welches zu einem geringeren Messfehler führt. Andererseits sind die Messungen vermischt: Jeder Wert beruht auf einer zufälligen Zusammensetzung von Zellen der zwei Typen. Das Ziel ist es, aus den aggregierten Proben dennoch Informationen zu den einzelnen Zelltypen zu gewinnen.

Um die Daten statistisch zu analysieren, benötigt man ein Wahrscheinlichkeitsmodell für die vorliegenden Messungen. Dies sieht so aus: Mit Wahrscheinlichkeit p ist eine zufällig ausgewählte Zelle vom Typ I, ansonsten vom Typ II. In beiden Fällen ist die Genexpression X dieser Zelle lognormalverteilt, d.h. der natürliche Logarithmus der Genexpression, log(X), ist normalverteilt. Dies ist eine übliche Annahme für Expressionsdaten. Allerdings besitzen die beiden Lognormalverteilungen unterschiedliche Parameter: Für Typ I hat log(X) den Mittelwert μ1 und die Standardabweichung σ1, ansonsten Mittelwert μ2 und Standardabweichung σ2 (s. Abb. 2). Die Parameter p, μ1, μ2, σ1 und σ2 sind unbekannt und sollen aus den Daten geschätzt werden.

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Kontaktieren Sie uns über: support.vogel.de (ID: 42648987)