Big Data

Evolution der Vögel durch Big-Data-Analyse erklärt

15.12.14 | Redakteur: Marc Platthaus

Für die Familie der Bienenfresser (im Bild Merops bullocki) zeigte die Studie eine enge Verwandtschaft mit Singvögeln, Papageien und Raubvögeln.
Bildergalerie: 2 Bilder
Für die Familie der Bienenfresser (im Bild Merops bullocki) zeigte die Studie eine enge Verwandtschaft mit Singvögeln, Papageien und Raubvögeln. (Bild: Peter Houde)

Hochleistungsrechner erlauben immer aufwändigere Datenberechnung. Wichtig ist aber ,dass diese Supercomputer auch mit den richtigen Algorithmen gefüttert werden. Wissenschaftler des Karlsruher-Instituts für Technologie (KIT) haben jetzt die Algorithmen für eine umfassende Big-Data-Analyse zur Stammbaum-Berechnung bei Vögeln entwickelt.

Karlsruhe – Rund 95 Prozent der über 10.000 bekannten Vogelarten entwickelten sich erst nach dem Aussterben der Dinosaurier vor rund 66 Millionen Jahren. Computeranalysen der genetischen Daten zeigen auch, dass sich die heutige Vielfalt explosionsartig aus wenigen Spezies bereits nach 15 Millionen Jahren entwickelt hatte. KIT-Forscher entwarfen die Algorithmen für die umfassende Analyse der Vogel-Evolution.

„Die Berechnung dieser Stammbäume für die Evolutionsforschung ist ohne entsprechende Algorithmen und Supercomputer nicht möglich“, erklärt Alexandros Stamatakis, Professor für High Performance Computing in den Lebenswissenschaften am Karlsruher Institut für Technologie und Leiter der Forschungsgruppe „Scientific Computing“ am Heidelberger Institut für Theoretische Studien (HITS). „Moderne Sequenzanalysen liefern heutzutage umfangreiche Gendaten über zahlreiche Spezies. Aber mit der Aufgabe, auch evolutionäres Wissen aus diesen riesigen und komplexen Datenmengen zu erzeugen, waren Computerprogramme bislang selbst auf Supercomputern überfordert.“

Nur noch einen Monat Rechenzeit statt 24 Monate

Obwohl Supercomputer mittlerweile Tausende Prozessoren besitzen, war die Software für Stammbaumanalysen auf etwa 500 Prozessoren beschränkt. „Wir mussten daher das Kommunikationsschema zwischen den Programmteilen auf verschiedenen Prozessoren überdenken und neu entwickeln,“ so Stamatakis. Der neue Ansatz beschleunigte die Software um den Faktor drei und ermöglicht es gleichzeitig die Rechnungen auf 4000 Prozessoren effizient zu verteilen. Informatiker sprechen hier von der Parallelisierung von Algorithmen. „Statt 24 Monate warten wir nun also nur einen Monat auf die Ergebnisse.“

Stammbaumberechnungen sind extrem rechenintensiv

Die Berechnung von Stammbäumen gehört zu einer extrem rechenintensiven Klasse von mathematischen Problemen (NP-Hard genannt). „Schon bei 50 Spezies gibt es mehr als 10 hoch 76 mögliche Stammbäume, aus denen der Richtige gefunden werden muss“, erklärt Andre J. Aberer, Doktorand am KIT und Mitarbeiter des HITS, der die Computeranalysen durchgeführt hat. „Zum Vergleich: Im Universum gibt es etwa 10 hoch 78 Atome.“ Die Algorithmen filtern zunächst grob die unwahrscheinlichen Evolutionsszenarien heraus. Unter den verbliebenen wird dann anhand der Daten von jeweils 14.000 Genen von 48 repräsentativen Vogelspezies der evolutionäre Stammbaum berechnet, der die Daten plausibel erklärt. Die neue parallele Software wurde am Höchstleistungsrechner „SuperMUC“ des Leibniz-Rechenzentrums der Bayerischen Akademie der Wissenschaften und zwei US-Rechenzentren ausgeführt. Die aufgewandte Rechenleistung entspricht einer Rechenzeit von 300 Jahren auf einem einzelnen Prozessor.

Methode auch auf andere Arten wie Viren und Bakterien übertragbar

„Die von uns entwickelten Methoden zur Stammbaumberechnung sind auf alle Arten von Lebewesen anwendbar“, so Stamatakis. Sie ermöglichten bereits eine umfassende Studie zum Stammbaum der Insekten mit 144 Arten, die vor veröffentlicht wurde. Aber auch der Ursprung und die Verbreitung von Viren und Bakterien lassen sich damit nachvollziehen, um etwa Krankheitserreger besser bekämpfen zu können. Die Analyse der genetischen Verwandtschaft von australischen Giftschlangen half entscheidend, die noch fehlende Gegengifte für einige Schlangenarten zu identifizieren.

Originalpublikation: Erich D. Jarvis, Siavash Mirarab, Andre J. Aberer, Bo Li, Peter Houde7, Cai Li, Simon Y. W. Ho, Brant C. Faircloth, Benoit Nabholz, Jason T. Howard, Alexander Suh, Claudia C. Weber, Rute R. da Fonseca, Jianwen Li, Fang Zhang, Hui Li, Long Zhou, Nitish Narula,, Liang Liu, Ganesh Ganapathy, Bastien Boussau, Md. Shamsuzzoha Bayzid, Volodymyr Zavidovych, Sankar Subramanian, Toni Gabaldón, Salvador Capella-Gutiérrez, Jaime Huerta-Cepas, Bhanu Rekepalli, Kasper Munch, Mikkel Schierup, Bent Lindow, Wesley C. Warren, David Ray, Richard E. Green, Michael W. Bruford, Xiangjiang Zhan,, Andrew Dixon, Shengbin Li, Ning Li, Yinhua Huang, Elizabeth P. Derryberry, Mads Frost Bertelsen, Frederick H. Sheldon, Robb T. Brumfield, Claudio V. Mello, Peter V. Lovell, Morgan Wirthlin, Maria Paula Cruz Schneider, Francisco Prosdocimi, José Alfredo Samaniego, Amhed Missael Vargas Velazquez, Alonzo Alfaro-Núñez, Paula F. Campos, Bent Petersen, Thomas Sicheritz-Ponten, An Pas, Tom Bailey, Paul Scofield, Michael Bunce, David M. Lambert, Qi Zhou, Polina Perelman, Amy C. Driskell, Beth Shapiro, Zijun Xiong, Yongli Zeng, Shiping Liu, Zhenyu Li, Binghang Liu, Kui Wu, Jin Xiao, Xiong Yinqi, Qiuemei Zheng, Yong Zhang, Huanming Yang, Jian Wang, Linnea Smeds, Frank E. Rheindt, Michael Braun, Jon Fjeldsa, Ludovic Orlando, F. Keith Barker, Knud Andreas Jønsson, Warren Johnson, Klaus-Peter Koepfli, Stephen O’Brien, David Haussler, Oliver A. Ryder, Carsten Rahbek, Eske Willerslev, Gary R. Graves, Travis C. Glenn, John McCormack, Dave Burt, Hans Ellegren, Per Alström, Scott V. Edwards, Alexandros Stamatakis, David P. Mindell, Joel Cracraft, Edward L. Braun, Tandy Warnow, Wang Jun, M. Thomas P. Gilbert, Guojie Zhang, Whole-genome analyses resolve early branches in the tree of life of modern birds, Science 12 December 2014: Vol. 346 no. 6215 pp. 1320-1331, DOI: 10.1126/science.1253451

Kommentare werden geladen....

Kommentar zu diesem Artikel abgeben
  1. Avatar
    Avatar
    Bearbeitet von am
    Bearbeitet von am
    1. Avatar
      Avatar
      Bearbeitet von am
      Bearbeitet von am

Kommentare werden geladen....

Kommentar melden

Melden Sie diesen Kommentar, wenn dieser nicht den Richtlinien entspricht.

Kommentar Freigeben

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Freigabe entfernen

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Infos finden Sie unter www.mycontentfactory.de (ID: 43126506 / Wissenschaft & Forschung)

 

Wissenschaft und Forschung mehr Artikel zum Thema finden Sie hier