Suchen

Per Raute leichter zu Millionen Daten

Wissenschaftler entwickeln Hashtags für Massenspektren

| Autor/ Redakteur: Sylvia Pieplow / Dr. Ilka Ottleben

Datenbankexperten aus Japan, Amerika und ganz Europa haben gemeinsam einen Code entwickelt, mit dem es möglich ist, die Informationen von Massenspektren zu vereinheitlichen. Der SPectraL-Hash oder SPLASH genannte Code soll jetzt die Suche nach Spektren im Internet erleichtern. Alle verfügbaren Informationen zu einem bestimmten Spektrum können mit diesem Spektren-Hashtag gezielt aus allen Datenbanken zusammengetragen und miteinander verglichen werden.

Firmen zum Thema

Alle verfügbaren Informationen zu einem bestimmten Massespektrum können mit einem neuen Spektren-Hashtag gezielt aus allen Datenbanken zusammengetragen und miteinander verglichen werden.
Alle verfügbaren Informationen zu einem bestimmten Massespektrum können mit einem neuen Spektren-Hashtag gezielt aus allen Datenbanken zusammengetragen und miteinander verglichen werden.
(Bild: gemeinfrei)

Halle – Die Massenspektrometrie ist ein hochsensitives Analyseverfahren, mit dem es möglich ist, geringste Substanzmengen – auch in Stoffgemischen - nachzuweisen. Die Technologie ist so leistungsfähig, dass man mit ihr ein Stück Würfelzucker in einem Schwimmbecken detektieren kann. Neben dem Nachweis von bereits bekannten Substanzen, wird die Massenspektrometrie auch zur Strukturaufklärung von neu entdeckten Verbindungen genutzt. Seit der Entwicklung der ersten kommerziellen Massenspektrometer in den 50-er Jahren, wurden Analysegeräte und Methoden ständig optimiert, sodass die Massenspektrometrie zu einem unentbehrlichen Werkzeug für die chemisch-biologische Grundlagenforschung, für Umwelt- und Klimaforschung, Medizin und Forensik geworden ist.

Hashtag soll historisch gewachsenen Wildwuchs an Massendaten entgegenwirken

Weltweit tragen die Experten täglich Gigabytes an Massendaten zusammen. Millionen Spektren sind zurzeit in ca. 20 größeren Datenbanken gespeichert – das entspricht einer Datenmenge von mehreren Petabyte, also mehreren Millionen Gigabyte. Unter diesen Spektren sind mehrere tausend Referenzspektren von bekannten Substanzen, auf die man bei Bedarf zum Vergleich der eigenen Messergebnisse zugreifen kann. Darüber hinaus werden die Datenbanken jedoch auch mit den Spektren noch unbekannter Substanzen gespeist, die man in jüngster Zeit vermehrt aus Pflanzen, Pilzen und marinen Organismen gewinnt. Die Speicherung der Spektren erfolgt dabei immer in dem jeweils datenbankspezifischen Format, sodass z.B. bei einer unbekannten noch namenlosen Substanz X nicht festgestellt werden kann, ob diese Substanz nicht schon an anderer Stelle beschrieben und als Spektrum gespeichert worden ist. Ein Informationsaustausch unter Wissenschaftlern, beispielsweise über wichtige Eigenschaften der Substanz X, wird dadurch erschwert. Diesem historisch gewachsenen Wildwuchs an Massendaten will man mit dem Splash-Code jetzt entgegenwirken.

Spektren werden auffindbar und alle verfügbaren Substanzinformationen zusammengetragen

Die von den Wissenschaftlern des internationalen Splash-Konsortiums entwickelten Programme können zu jedem vorhandenen Spektrum einen Code generieren, der ebenso wie ein Hashtag funktioniert. Dadurch werden Spektren im Internet nicht nur auffindbar, man kann zudem alle verfügbaren Substanzinformationen aus verschiedenen Datenbanken zusammentragen. Spektren von noch unbekannten Substanzen erhalten mit dem Splash-Code ihren ersten Namen, was die Kommunikation über diese Stoffe extrem erleichtert. Auch die Bioinformatiker des Leibniz-Instituts für Pflanzenbiochemie in Halle, allen voran Dr. Steffen Neumann, haben als Mitglieder des Splash-Konsortiums die Entwicklung des Hashtags maßgeblich vorangetrieben. Am Leibniz-Institut für Pflanzenbiochemie (IPB) hat die Massenspektrometrie eine lange Tradition. Bereits 1969 besaß das Institut eines der begehrten und in der DDR nur in vier Exemplaren hergestellten Elektronenanlagerungsmassenspektrographen von Manfred von Ardenne. Heute werden am IPB mit modernen Massenspektrometern etwa 10.000 Proben im Jahr analysiert.

Originalpublikation: Gert Wohlgemuth, Sajjan S. Mehta, Ramon F. Mejia, Steffen Neumann, Diego Pedrosa, Tomáš Pluskal, Emma L. Schymanski, Egon L. Willighagen, Michael Wilson, David S. Wishart, Masanori Arita, Pieter C. Dorrestein, Nuno Bandeira, Mingxun Wang, Tobias Schulze, Reza M. Salek, Christoph Steinbeck, Venkata Chandrasekhar Nainala, Robert Mistrik, Takaaki Nishioka & Oliver Fiehn. SPLASH, a hashed identifier for mass spectra. Nature Biotechnology 34, 1099–1101 (2016) doi:10.1038/nbt.3689

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Kontaktieren Sie uns über: support.vogel.de (ID: 44384016)