Humangenom-Sequenzierung Meilenstein zur Kostenreduzierung bei der Humangenom-Sequenzierung erreicht
Diese Erkenntnisse könnten die Tür zu neuen Untersuchungsmöglichkeiten für die genetische Diversität beim Menschen öffnen: Eine neue Sequenzierungstechnologie von Applied Biosystems zur Analyse humaner Genome reduziert nicht nur erheblich die Kosten, sondern ist gleichzeitig schneller und genauer als bisherige Systeme. Das Unternehmen stellt nun der Wissenschaft die Sequenzdaten zur Verfügung.
Anbieter zum Thema
Foster City, USA – Applied Biosystems hat einen bedeutenden Schritt zur Kostenreduzierung der DNA-Sequenzierung gemacht: Wissenschaftler der Firma haben ein menschliches Genom mit Hilfe ihres Next-Generation-Systems zur genomischen Analyse resequenziert. Die Sequenzdaten, die in diesem Projekt generiert wurden, offenbaren zahlreiche bislang unbekannte genetische Sequenzvariationen, die von großem Interesse für die Medizin sein könnten. Außerdem gewähren die Daten einen detaillierten Blick in die Strukturvarianten eines kompletten menschlichen Genoms. Damit gehören sie zu den gründlichsten und tiefgehendsten Analysen menschlicher Genomsequenzen. Applied Biosystems stellt die Informationen über eine Datenbank des National Center for Biotechnology Information (NCBI) weltweit der Wissenschaft zur Verfügung.
Meilenstein zur Kostenreduzierung bei der Humangenom-Sequenzierung erreicht
Applied Biosystems analysierte die humane Genomsequenz mit einem Kostenaufwand von weniger als 60 000 Dollar – einem Bruchteil der Kosten, die bislang für das Erzeugen von Genomdaten angefallen sind. Diese Summe entspricht dem kommerziellen Preis für alle Reagenzien, die zur Durchführung des Projekts benötigt werden. Demgegenüber waren etwa 300 Millionen Dollar für das Humangenomprojekt ausgegeben worden. Damit liegen die Kosten unter der 100 000-Dollar-Marke, dem Meilenstein der Industrie für die nächste Generation der DNA-Sequenziertechnologien.
Die öffentlich zugänglichen Sequenzdaten könnten Wissenschaftlern helfen, genetische Variation beim Menschen besser zu verstehen. Verbindungen zwischen der genetischen Variabilität sowie der Empfänglichkeit für und der Reaktion auf bestimmte Behandlungen von Krankheiten besser zu erklären ist ein Ziel der personalisierten Medizin. Obwohl der größte Teil der genetischen Information bei allen Menschen identisch ist, sind Forscher gerade an dem Anteil des genetischen Materials interessiert, der zwischen verschiedenen Individuen variiert. Bei der Charakterisierung der Variationen unterscheiden sie zwischen Einzelbasen-Austauschen und größeren Sequenzvariationen, die man auch Strukturvarianten nennt. Letztere umfassen Insertionen, Deletionen, Inversionen oder Translokationen von DNA-Sequenzen. Sie sind oft nur wenige Basenpaare lang. Es ist aber auch möglich, dass ihre Länge einigen Millionen Basenpaare beträgt, was einen größeren Einfluss auf die Gene und somit auf die Entstehung von Krankheiten haben könnte.
Bis zu neun Gigabasen pro Lauf
Eine Forschergruppe unter der Leitung von Kevin McKernan, dem Senior Director of Scientific Operations von Applied Biosystems, resequenzierte eine menschliche DNA-Probe aus dem internationalen HapMap Project. Das Team erzeugte mit Hilfe ihres SOLiDTM Systems 36 Gigabasen Sequenzdaten in sieben Läufen. Sie erreichten damit einen Durchsatz von bis zu neun Gigabasen pro Lauf, das ist der höchste Durchsatz, von dem jemals ein Anbieter von DNA-Sequenziersystemen berichtet hat. Die 36 Gigabasen Sequenzdaten decken den Inhalt des menschlichen Genoms mehr als 12 Mal ab. Damit konnten die Wissenschaftler die genaue Reihenfolge der DNA-Basen besser bestimmen. Außerdem konnten sie die Millionen von Einzelbasenaustausche (SNPs), die es in einem menschlichen Genom gibt, zuverlässiger identifizieren. Die Forschergruppe bestimmte außerdem Genomregionen, die Strukturvarianten aufwiesen, mit mehr als der 100-fachen physischer Abdeckung. Somit konnten größere Sequenzabschnitte, die im Vergleich zum humanen Referenzgenom variierten, lokalisiert werden.
Durch 2-Base-Encoding-Verfahrens wird Genauigkeit von mehr als 99,94 Prozent erreicht
Das Team von McKernan benutzte das SOLiD-System und seine Ultra-Hochdurchsatz-Technologie, um eine weitreichende Sequenzabdeckung des Genoms eines unbekannten Afrikaners aus dem Stamm der Yoruba aus Ibadan, Nigeria, zu erhalten. Der Afrikaner hatte am Internationalen HapMap-Projekt teilgenommen. Die Wissenschaftler konnten die detaillierten Analysen von Strukturvarianten erreichen, indem sie viele Paired-End-Bibliotheken der Genomsequenz anfertigten, die Inserts von ganz unterschiedlicher Länge besaßen. Die meisten Inserts waren größer als 1000 Basen. Mit dem SOLiD-System können Paired-End-Bibliotheken mit großen Inserts analysiert werden. Während des Projektes wurden außerdem Millionen SNPs identifiziert. Das SOLiD-System ist in der Lage, mit Hilfe des 2-Base-Encoding-Verfahrens zufällige und systematische Fehler von wahren SNPs mit einer Genauigkeit von mehr als 99,94 Prozent zu unterscheiden.
Höhere Durchsätze durch Skalierbarkeit
Eine weitere wichtige Eigenschaft des SOLiD-Systems ist seine Skalierbarkeit, die es von anderen DNA-Sequenzierplattformen unterscheidet. Damit können höhere Durchsätze erreicht werden, ohne dass dafür Änderungen an der Hardware vorgenommen werden müssten. Der hohe Durchsatz, die Genauigkeit und die Fähigkeit zur Paired-End-Analyse des SOLiD-Systems werden die Kosten zur Durchführung komplexer Genomstudien wohl weiter reduzieren. Damit wird es künftig einfacher sein, Genomvariationen und ihre mögliche Beteiligung an der Entstehung von Krebs, Diabetes, Herzkrankheiten oder anderen Erkrankungen zu charakterisieren.
Genetische Variationen und Krebs
Ansätze zur detailierten Resequenzierung enthüllen bislang unbekannte genetische Variationen im menschlichen Genom. Forscher wie beispielsweise der Wissenschaftler Dr. John McPherson am Ontario Institute for Cancer Research erhoffen sich, dass diese genetischen Variationen künftig leichter mit Krankheiten wie zum Beispiel Krebs assoziiert werden können. McPherson katalogisiert genetische Variationen verschiedener Krebsarten, um Tumore besser klassifizieren zu können und die frühen Ereignisse, die die Krankheit vorantreiben, zu erkennen. Denn diese sind wahrscheinlich wichtige Angriffspunkte für die (Weiter-)Entwicklung von Behandlungsmethoden und Diagnose-Tools.
„Die Paired-End-Technologie ist essenziell für die Analyse ganzer menschlicher Genome“, so McPherson. „Der enge Fragmentgrößenbereich, der durch die SOLiD-Protokolle gewährleistet wird, erlaubt die Identifizierung von Insertionen und Deletionen unterschiedlichster Länge. Strukturelle Rearrangements können leicht lokalisiert werden, und die weitreichende Genom-Abdeckung wird einfach durch den hohen Durchsatz der Plattform erreicht.“
Neuen Untersuchungsmöglichkeiten für die genetische Diversität beim Menschen
Dr. Evan Eichler ist Associate Professor der Genome Sciences der Universität of Washington`s School of Medicine und gleichzeitig Forscher am Howard Hughes Medical Institute. Er fokussiert seine Forschung auf die Rolle von Duplikaten und Strukturvarianten im menschlichen Genom. Mit Hilfe von Experimenten und Computerleistung untersucht er den Aufbau dieser Regionen und ihren Beitrag zur Evolution und der Entstehung von Krankheiten.
„Um das Ausmaß und die Prävalenz von Strukturvariationen innerhalb der menschlichen Genoms zu verstehen, hat unsere Arbeitsgruppe bisher traditionelle Sequenzierverfahren angewendet – mit guten Ergebnissen. Aber für vieles brauchen wir wesentlich höhere Analysegeschwindigkeiten“, so Dr. Eichler. „Die humanen Paired-End-Daten gehen so stark in die Tiefe, dass es möglich wird, kleinere Strukturvarianten mit höherer Auflösung zu entdecken. Indem die Datensätze öffentlich zugänglich gemacht werden, ist es künftig einfacher, Strukturvariationen beim Gesunden und beim Kranken besser zu verstehen. Die Erkenntnisse werden uns die Tür zu neuen Untersuchungsmöglichkeiten für die genetische Diversität beim Menschen öffnen.“
Neue Softwareanalyse-Tools für das Next-Generation-Sequencing
Next-Generation-Sequenzierplattformen erlauben es Forschern, mehr genetisches Datenmaterial zu erzeugen als je zuvor. Das Resequenzierungsprojekt von Applied Biosystems stellt einen der bisher umfangreichsten Datensätzen aus Genomdaten dar. Es soll Forscher mit ganzen Bibliotheken aus Sequenzdaten versorgen, die ihnen bei der Analyse weiterer komplexer Genome in künftigen Projekten helfen können.
Applied Biosystems erwartet, dass die öffentliche Verfügbarkeit der Sequenzdaten auch Innovation und Geschwindigkeit in die Entwicklung neuer Bioinformatiktools bringt. Solche Tools können Forschern bei der Interpretation von Daten helfen und Anhaltspunkte für das bessere Verständnis von Gesundheit und Krankheit bringen. Zusätzlich zu dem vollständigen Sequenzdatensatz liefert NCBI auch Teildatensätze. Diese können von unabhängigen akademischen oder kommerziellen Softwareentwicklern genutzt werden, um die Entwicklung von Analysetools voranzutreiben. Applied Biosystems macht ein Analysetool über die SOLiD System Software Development Community verfügbar. Dieses soll unabhängigen Software-Providern bei der Interpretation der Teildatensätze helfen.
Über seine Software Development Community hat Applied Biosystems Kontakte zwischen Wissenschaftlern und Bioinformatikunternehmen hergestellt. Diese sollen Wissenschaftlern helfen, den Herausforderungen des Next-Generation-Sequencing zu begegnen und neue Tools zu entwickeln, die die Datenanalyse und das Data-Management verbessern.
(ID:248397)

