Worldwide China

Hochdurchsatzdaten selbst auswerten

Selbst ist der Forscher: Big-Data-Analysen leicht gemacht

| Autor / Redakteur: Dr. Anika Erxleben & Dr. Björn Grüning* / Dr. Ilka Ottleben

Große Vielfalt an Visualisierungsmöglichkeiten

Neben einer großen Zahl an Datenanalyse- und Statistik-Tools stellt Galaxy eine Vielzahl an Visualisierungsmöglichkeiten zur Verfügung. Neben diversen Diagrammtypen, die man aus Excel kennt, z.B. Balkendiagramme und Venn-Diagramme, können u.a. auch interaktive Heatmaps, phylogenetische Bäume und zirkuläre Diagramme in hochauflösender Qualität erstellt werden.

2 Galaxy bietet u.a. einen direkten Zugang zu einer Vielzahl verschiedener Datenbanken wie NCBI (BLAST).
2 Galaxy bietet u.a. einen direkten Zugang zu einer Vielzahl verschiedener Datenbanken wie NCBI (BLAST). (Bild: Galaxy Europe Server)

Galaxy bietet darüber hinaus einen direkten Zugang zu einer Vielzahl verschiedener Datenbanken. So können Daten aus beispielsweise ENSEMBL, NCBI (BLAST), ENA, dem UCSC Main Table Browser oder UniProt direkt in Galaxy importiert werden. Prinzipiell kann jedes Tool oder auch ein selbstgeschriebenes Programm in Galaxy integriert werden. Bei Bedarf kann dafür das Freiburg-Galaxy-Team kontaktiert werden.

Als Galaxy-Benutzer muss man sich zudem keine Sorgen über die Rechenkapazitäten des eigenen Computers machen. Hinter dem Galaxy Europe Server steht neben dem Supercomputer Nemo die Cloud des Deutschen Netzwerks für Bioinformatik Infrastruktur (de.NBI), welche jedem Benutzer Datenspeicher und Rechenkapazitäten zur Verfügung stellt. Wer keinen permanenten Internetzugang hat, seine Daten lieber lokal auf seinem PC speichern möchte oder mit klinischen Daten arbeitet, kann alle präparierten Workflows mit allen dazugehörigen Tools und Tutorials als so genannte Container herunterladen. Ein Container ist eine komplette Galaxy-Workbench mit allem was man braucht, zugeschnitten auf eine ausgewählte Analyse.

Tutorials zum Selbststudium und Interactive Tours

Für viele Analysen von Hochdurchsatzdaten stehen für Galaxy standardisierte Analyse-Workflows und Tutorials zur Verfügung, die auf der Galaxy-Trainingsseite veröffentlicht sind. Es gibt dort derzeit mehr als 50 Tutorials zum Selbststudium, u.a. zur Benutzung von Galaxy, RNAseq, ChIPseq, Variant calling, Epigenetik, Proteomics, Metabolomics und Metagenomics. Die Tutorials beinhalten immer einführende Präsentationen zum jeweiligen Thema, Trainingsdatensätze und eine detaillierte Schritt-für-Schritt-Anleitung (Hands-on-Training) des jeweiligen Analyse-Workflows.

Darüber hinaus kann man sich in so genannten Interactive Tours durch jeden Schritt der Analyse führen lassen. Dabei beschreibt ein kleines Fenster was genau zu tun ist und zeigt, wo das jeweilige Tool zu finden ist. In einer Interactive Tour werden echte Daten live analysiert. Jeder Nutzer kann mit den Pfeiltasten seiner Tastatur selbst entscheiden, wie schnell er sich durch die Analyse leiten lässt oder ob er beispielsweise einen Schritt nochmal wiederholen möchte, um ihn besser zu verstehen.

Ergänzendes zum Thema
 
Das Freiburg-Galaxy-Team bietet Hands-on-Training

Galaxy gibt jedem Wissenschaftler die Möglichkeit, seine Daten selbst zu analysieren und stellt dafür eine Vielzahl an Tools, Workflows und Trainingsmaterial zur Verfügung. Für Kooperationen, Workshops und weiteren Hilfestellungen steht das Freiburg-Galaxy-Team gern zur Verfügung.

Finanziert wird das Freiburg-Galaxy-Projekt durch das Deutsche Netzwerk für Bioinformatik-Infrastruktur (de.NBI), ELIXIR und dem SFB 992 (Medical Epigenetics).

Literatur:

[1] Wolff et al. (2018) Galaxy HiCExplorer: a web server for reproducible Hi-C data analysis, quality control and visualization. Nucleic Acids Research, 46, W11–W16.

[2] Batut et al. (2018) ASaiM: a Galaxy-based framework to analyze microbiota data. Gigascience. 2018 Jun; 7(6): giy057.

[3] Batut,B. et al. (2018) Community-Driven Data Analysis Training for Biology. Cell Systems, 6, 752–758.e1.

[4] Afgan,E. et al. (2016) The Galaxy platform for accessible, reproducible and collaborative biomedical analyses: 2016 update. Nucleic acids research, 44, W3–W10.

* Dr. A. Erxleben, Dr. B. Grüning: Universität Freiburg, Lehrstuhl für Bioinformatik, 79110 Freiburg

Inhalt des Artikels:

Kommentare werden geladen....

Kommentar zu diesem Artikel abgeben

Der Kommentar wird durch einen Redakteur geprüft und in Kürze freigeschaltet.

  1. Avatar
    Avatar
    Bearbeitet von am
    Bearbeitet von am
    1. Avatar
      Avatar
      Bearbeitet von am
      Bearbeitet von am

Kommentare werden geladen....

Kommentar melden

Melden Sie diesen Kommentar, wenn dieser nicht den Richtlinien entspricht.

Kommentar Freigeben

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Freigabe entfernen

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Infos finden Sie unter www.mycontentfactory.de (ID: 45497970 / Bio- & Pharmaanalytik)