Suchen

Registrierungspflichtiger Artikel

Hochdurchsatzdaten selbst auswerten

Selbst ist der Forscher: Big-Data-Analysen leicht gemacht

| Autor/ Redakteur: Dr. Anika Erxleben & Dr. Björn Grüning* / Dr. Ilka Ottleben

Die Analyse teils mühselig erhobener Daten geben Forscher nur ungern aus der Hand. Doch in Zeiten von Big Data kann genau diese Aufgabe einen in IT weniger versierten Lebenswissenschaftler an seine Grenzen bringen. Hochkomplexe Programme ohne Informatikkenntnisse selbst anwenden? Der neue Galaxy Europe Server macht das nun möglich.

Firmen zum Thema

Abb. 1: In Zeiten von Big Data sind viele in den Lebenswissenschaften erhobene Daten wie Sequenzinformationen kaum noch „per Hand“ auszuwerten. Hochkomplexe Softwareprogramme helfen, sind jedoch nicht leicht zu bedienen.
Abb. 1: In Zeiten von Big Data sind viele in den Lebenswissenschaften erhobene Daten wie Sequenzinformationen kaum noch „per Hand“ auszuwerten. Hochkomplexe Softwareprogramme helfen, sind jedoch nicht leicht zu bedienen.
(Bild: ©lily - stock.adobe.com)

Viele Lebenswissenschaftler kennen das: Vom Sequen­zierlabor kommt eine E-Mail, dass die Rohdaten der RNA-Sequenzierung oder des ChIP-Experimentes zum Download bereitstehen. Um die Hochdurchsatzdaten auszuwerten, werden im Studium selten ausreichende Kenntnisse zur statistischen Auswertung vermittelt. Zur Auswertung geeignete Software ist oft kommerziell. Um kostenfreie Open Source Software nutzen zu können, sind hingegen fast immer Programmierkenntnisse notwendig und viele Programme sind in Windows nicht lauffähig. All dies stellt viele Forscher vor große Probleme.

Die meisten Wissenschaftler möchten ihre Daten gerne selbst auswerten oder sich zumindest daran beteiligen. Das Freiburg-Galaxy-Team am Lehrstuhl für Bioinformatik (Prof. Rolf Backofen) der Universität Freiburg unterstützt diese Forscher, indem sie Open-Source-Programmen in Galaxy eine grafische Oberfläche geben. Auf diese Weise ist es jedem Wissenschaftler möglich, hochkomplexe Programme ohne Informatikkenntnisse selbst zu verwenden, um eigenständig beispielsweise Big Data aus Sequenzier-Projekten auszuwerten.