Worldwide China

Big Data im Life-Science-Labor

Aktive Hilfe beim Handling großer Datenmengen

| Redakteur: Dr. Ilka Ottleben

Prof. Dr. Alfred Pühler (links) und Dr. Alexander Sczyrba (rechts), CeBiTec, Universität Bielefeld
Prof. Dr. Alfred Pühler (links) und Dr. Alexander Sczyrba (rechts), CeBiTec, Universität Bielefeld (Bild: Universität Bielefeld)

Große Datenmengen im Life-Science-Labor: Das Deutsche Netzwerk für Bioinformatik-Infrastruktur hilft sie zu bewältigen – mit Service, Training und bald auch per Cloud Computing. Wie ist dieses Netzwerk strukturiert? Welche Vorteile bietet es den Nutzern? Und wie genau will es dem Big-Data-Problem in den Lebenswissenschaften begegnen? Das erläutern zwei der beteiligten Wissenschaftler im LP-Exklusivinterview. Das Gespräch führte LP-Chefredakteur Marc Platthaus.

LP: Daten allein sind in den Lebenswissenschaften häufig von geringer Aussagekraft, denn sie müssen auch sinnvoll ausgewertet werden. Mitunter keine leichte Aufgabe im Zeitalter von Big Data?

Prof. Dr. Alfred Pühler: In der Tat – in den Lebenswissenschaften entstehen immer größere Datenmengen, die nur noch mit komplexen Bioinformatikprogrammen und großen Rechenanlagen analysiert werden können. Das Deutsche Netzwerk für Bioinformatik-Infrastruktur (de.NBI) wurde eingerichtet, um genau dieses Big-Data-Problem in den Lebenswissenschaften in den Griff zu bekommen.

LP: Wie genau ist dieses Netzwerk strukturiert, was sind seine Aufgaben?

Prof. Dr. Alfred Pühler: Im März 2015 wurden acht Servicezentren aus­gewählt und mit der Aufgabe betraut, über eine Netzwerkstruktur, experimentellen Gruppen bei der Analyse großer Datenmengen zu helfen. Diese acht Servicezentren unterscheiden sich in ihrer thematischen Ausrichtung. Das Heidelberger Zentrum beschäftigt sich mit Bioinformatik im Bereich Humangenetik, während sich das Bielefelder Zentrum auf mikrobielle (Meta-)Genomik konzentriert. Das Zentrum in Gatersleben bearbeitet die Bioinformatik zur Pflanzengenomik. Proteom-Bioinformatik wird im Bochumer Zentrum angeboten, während RNA-Bioinformatik durch das Freiburger Zentrum vertreten wird. Weitere Themen sind die integrative Bioinformatik im Tübinger Zentrum und die Bioinformatik zur Systembiologie in einem zweiten Heidelberger Zentrum. Schließlich werden Biologische Daten im Bremer Zentrum bearbeitet.

Dr. Alexander Sczyrba: Die Hauptaufgaben des de.NBI-Netzwerks bestehen im Angebot und in der Durchführung von Dienstleistungen und Trainingskursen. Dazu wird zur Analyse der großen Datenmengen neueste Bioinformatik-Software eingesetzt, deren Funktionsweise den Nutzern in Trainingskursen vermittelt wird.

Ergänzendes zum Thema
 
Zu den Personen – Pühler und Sczyrba

Prof. Dr. Pühler: Im vergangenen Jahr wurde das Aufgabenspektrum des de.NBI-Netzwerks dann nochmals drastisch erweitert. Zunächst wurden neue Partnerprojekte integriert, die die Themenvielfalt des Netzwerks abrunden. Im Weiteren gelang es, eine Kooperation mit dem europaweiten Elixir-Netzwerk zu vereinbaren, die eine Synchronisation der Arbeitsabläufe zwischen den beiden Netzwerken de.NBI und Elixir ermöglicht.

LP: Das de.NBI-Netzwerk soll zudem mit einer so genannten Cloud ausgestattet werden. An welchen Standorten soll sie etabliert werden?

Prof. Dr. Pühler: Im letzten Jahr stellte das Bundesministerium für Bildung und Forschung dem de.NBI-Netzwerk für die nächsten drei Jahre 6 Millionen Euro zur Verfügung, um eine zukunftsorientierte Rechnerstruktur, die so genannte de.NBI-Cloud zu etablieren. Das de.NBI-Netzwerk hat daraufhin entschieden, dass die de.NBI-Cloud an den Standorten Bielefeld, Gießen, Heidelberg, Freiburg und Tübingen realisiert werden soll. Diese de.NBI-Cloud wird übrigens noch durch sechs Personalstellen unterstützt, die dazu gedacht sind, den wissenschaftlichen Betrieb der de.NBI-Cloud zu organisieren.

LP: Welche Vorteile bieten Clouds, und wer profitiert davon?

Dr. Sczyrba: In der Vergangenheit hätte man bei der Investition in ein Hochdurchsatz-Sequenziergerät gleichzeitig in Rechnerinfrastruktur investieren müssen, um die anfallenden Daten weiterzuverarbeiten. Diese Rechenressourcen wurden dann aber von den einzelnen Laboren meist nur sporadisch genutzt, nämlich immer dann, wenn gerade experimentelle Daten anfielen. Durch die gemeinsame Nutzung von Ressourcen können sich so erhebliche Kosteneinsparungen ergeben. Eine Investition in lokale Computer-Hardware ist also nicht mehr nötig. „Cloud Computing“ bietet einen neuen Ansatz, dynamische, hoch skalierbare Software-Lösungen zu entwickeln und bereitzustellen. Durch die Flexibilität dieser Umgebungen können unterschiedlichste Anforderungen erfüllt und so auf die verschiedensten Analysewerkzeuge sehr speziell zugeschnitten werden. Durch diese so genannten virtualisierten Umgebungen spielt es keine Rolle mehr, auf welchen Computern die Analysen tatsächlich durchgeführt werden. Ein Wechsel zwischen den Cloud-Standorten ist leicht möglich. Dies war in der Vergangenheit mit den traditionellen Hochleistungsrechenzentren nur schwer realisierbar. Weiterhin können große Datenbanken zentral zur Verfügung gestellt werden und müssen nicht erst auf lokalen Ressourcen verfügbar gemacht werden.

LP: Wann wird die Cloud zur Verfügung stehen?

Prof. Dr. Pühler: Die de.NBI-Zentren werden im laufenden Jahr damit beginnen, ihre Dienstleistungen über die de.NBI-Cloud den Wissenschaftlern aus den Lebenswissenschaften zur Verfügung zu stellen. Ebenso ist die Einrichtung spezieller virtueller Arbeitsumgebungen geplant, die Datenwissenschaftlern die grundlegenden Werkzeuge für ihre speziellen Analysen zur Verfügung stellen sollen.

Dr. Sczyrba: In den nächsten Monaten soll die Hardware installiert und die Cloud-Computing-Plattform Openstack an allen Standorten installiert werden. Es ist geplant, dass die de.NBI-Cloud Mitte 2017 den Betrieb mit ersten Betatest-Nutzern aufnehmen soll. Um die Portierung von Dienstleistungen in die Cloud zu unterstützen, wird das de.NBI-Netzwerk in diesem Jahr eine spezielle Sommerschule zum Cloud Computing anbieten.

Herr Prof. Dr. Pühler, Herr Dr. Sczyrba, vielen Dank für das Gespräch.

Kommentare werden geladen....

Kommentar zu diesem Artikel abgeben
  1. Avatar
    Avatar
    Bearbeitet von am
    Bearbeitet von am
    1. Avatar
      Avatar
      Bearbeitet von am
      Bearbeitet von am

Kommentare werden geladen....

Kommentar melden

Melden Sie diesen Kommentar, wenn dieser nicht den Richtlinien entspricht.

Kommentar Freigeben

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Freigabe entfernen

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Infos finden Sie unter www.mycontentfactory.de (ID: 44513152 / Bio- & Pharmaanalytik)