English China
Suchen

Big Data Von kleinen Proben zu Big Data: die Zukunft des digitalen Labors

Autor / Redakteur: Florian Hauer* und Martin Koch* / Dipl.-Chem. Marc Platthaus

In allen Lebensbereichen steigt die Menge der Daten, die erzeugt wird – Labore bilden da keine Ausnahme. Immer versatilere High-Throughput- und High-Content-Analysemethoden erzeugen immer mehr Daten. Große Datenmengen allein sind jedoch nicht automatisch Big Data.

Firmen zum Thema

Abb. 2: In vielen Laboren besteht jedoch die Herausforderung, dass oft sehr heterogene Datenformate für die digitale Dokumentation verwendet werden.
Abb. 2: In vielen Laboren besteht jedoch die Herausforderung, dass oft sehr heterogene Datenformate für die digitale Dokumentation verwendet werden.
(Bild: labfolder)

Immer ausgereiftere High-Throughput- und High-Content-Analysemethoden, die zunehmende Vernetzung, aber auch die Zunahme der Kooperationsprojekte zwischen Forschungseinrichtungen, der pharmazeutischen Industrie und kleineren Laboren erzeugt ein stetig wachsendes Datenvolumen. Die ständig wachsenden Datenmengen stellen damit nicht nur Anforderungen an die Labor-IT, sie eröffnen auch neue Möglichkeiten der Datenanalyse und den damit verbundenen Wertschöpfungsprozessen, die im Allgemeinen unter dem Begriff Big Data zusammengefasst werden.

Große Datenmengen allein sind jedoch nicht automatisch Big Data: Nur wenn es gelingt, Daten in einem Format abzulegen, in dem diese effektiv durchsucht werden können, sodass neue Zusammenhänge hergestellt und übergreifende Analysen durchgeführt werden können, dann kann auch aus diesen Daten Mehrwert erzeugt werden.

Bildergalerie

Ein anschauliches Beispiel beruht auf der oft unüberschaubaren Vielzahl von Prozessparametern eines Experiments. Diese sind in der Vergangenheit zwar bereits getestet worden, aber diese so genannten Meta-Daten stehen ad hoc nicht zur Verfügung, so wurden in den Laboren viele Versuche und Messungen unnötig wiederholt. Hier ließen sich schon in einem sehr einfachen Anwendungsbeispiel mit Big Data Zeit, Geld und Ressourcen sparen.

Doch bis dahin ist es noch ein weiter Weg: In vielen Laboren sind Daten und Informationen auf lokalen Datenträgern, in Papiernotizbüchern und in Aktenordnern verstreut, wo sie für Big-Data-Anwendungen nicht zur Verfügung stehen.

Big Data im digitalisierten Labor

Voraussetzung für die Nutzung von Big Data ist die Integration aller Daten im Labor auf einer einheitlichen digitalen Plattform. Auf dieser Plattform muss nicht nur eine Archivierung aller Daten möglich sein, sondern auch die einheitliche und strukturierte Erfassung von Prozessen, die einen Datenvergleich auf Prozessebene ermöglichen. Um die immer größer werdenden Datenmengen handhaben zu können, ist auf lange Sicht eine direkte Anbindung von Infrastruktur für Analyse und Produktion in die Labor-IT unumgänglich. Auf diese Weise können Daten automatisch erhoben werden und ein kontinuierliches Tracking zu jedem Zeitpunkt sichergestellt werden, sodass eine Vielzahl versteckter Einflussfaktoren aufgezeichnet werden können. Diese Aufzeichnungen können später analysiert werden, um jeweilige Auswirkungen auf Ablauf und Ergebnisse der Versuche nachvollziehbar zu machen.

Digitalisierung von Labordaten als Herausforderung

Die Digitalisierung der Labordaten ist bereits seit vielen Jahren eine Herausforderung für die tägliche Laborpraxis. Zurzeit ist bereits eine Fülle digitaler Laborbücher (Electronic Lab Notebooks, ELNs) und Labor-IT-Systeme (Laboratory Information Management Systems, LIMS) verfügbar, dennoch verwenden noch nicht alle Labore ein einheitliches System für die digitale Dokumentation. Verschiedene Trends, allen voran die Weiterentwicklung von erschwinglichen mobilen Eingabegeräten wie Tablets und Smartphones, begünstigen jedoch eine weitere Verbreitung von digitalen Systemen. In vielen Laboren besteht die Herausforderung, dass oft sehr heterogene Datenformate verwendet werden. Darunter sind zwar auch generische Formate wie Word, Excel, PDF und Bilddateien zu finden, oft aber auch spezielle Dateiformate, die von spezialisierten Geräten erzeugt werden.

Um diese Daten in einen größeren Zusammenhang zu bringen, kann es eine große Hilfe sein, die Daten anhand der Prozesse zu strukturieren, in denen Sie erzeugt worden sind – das Anhängen einer Bilddatei z.B. aus einem Spektrometer an ein digitales Messprotokoll ist ein einfaches Beispiel dafür. Um diese Bilddaten mit anderen Daten zu vergleichen, müssen nun nicht alle Bilder miteinander verglichen werden, sondern nur jene, die mit vergleichbaren Messprotokollen erzeugt worden sind. Dieses Beispiel zeigt, dass vor der Nutzung von Big Data, zunächst einmal die Probleme von Small Data gelöst werden müssen: Aktuell sind in Laboren meist viele kleine Datensätze zu finden, die nur sehr schwer in Zusammenhang gebracht werden können.

Auf dem Weg zu einer Nutzung von Big Data steht daher zunächst die Etablierung eines Standards, mit dem Laborprozesse leicht erfasst, archiviert und vor allem miteinander verglichen werden können. Ein einheitliches Format, in dem multi- und interdisziplinäre Labor- und Forschungsprozesse abgebildet und verglichen werden können, existiert bisher noch nicht.

Vernetzung von Laborgeräten mit der Labor-IT

Labor- und Messgeräte sind integraler Bestandteil der Datenpipelines in jedem Labor: Sie erzeugen den Großteil aller anfallenden Daten. Diese Daten werden oft auf lokalen Messrechnern ohne Netzwerkzugang oder in unübersichtlichen Netzwerklaufwerken gespeichert. Durch einen oft sehr mühseligen Transfer der Daten (z.B. via USB-Stick) ist es nur sehr schwer möglich, Gerätedaten mit den restlichen Daten und Protokollen im Labor in Zusammenhang zu bringen – abgesehen davon, dass eine dezentrale Organisation von Geräten weitere Nachteile wie Einschränkungen bei der durchgängigen Nutzung, der Nutzungsplanung in Arbeitsgruppen und der dezentralen Archivierung von Daten mit sich bringt.

Um die Lücke zwischen Laborgeräten und Labor-IT zu schließen, hat sich unter dem Namen „SiLA Rapid Integration“ ein internationales Konsortium aus Geräte- und Laborproduktherstellern, Forschungsinstituten und Pharmaunternehmen zusammengetan, um einen einheitlichen Standard zur Ansteuerung von Laborgeräten zu definieren. Ziel dieses Standards ist es u.a., Laborgeräte auch von verschiedenen Herstellern über ein einheitliches Interface, ein so genanntes Process-Management-System (PMS) anzusprechen. Dieses PMS ist über einen Web Service über das gesamte Netzwerk, oder über gesicherte Verbindungen auch über das Internet erreichbar.

So können sich Kollegen im Labor von jedem Rechner mit gesichertem Zugriff auf das Netzwerk – sei es innerhalb des gleichen Gebäudes oder auf einem anderen Kontinent – an dem Gerät anmelden, Laufparameter eingeben und Daten von dem Gerät empfangen. Bei entsprechender Automatisierung können so ganze Mess- oder Produktionszyklen aus der Ferne gesteuert und überwacht werden.

Die Integration von Geräten über den SiLA-Standard (Standards in Lab Automation ) ist dabei auf verschiedenen Wegen möglich: z.B. über einen SiLA-kompatiblen Treiber, der auch nicht-konformen Geräten eine Kommunikation mit dem Webservice ermöglicht. Ein SiLA Interface Converter ermöglicht es Geräten, auf denen Daten und Dienste in einem kompatiblen Format bereitgestellt werden, über einen Webservice mit dem Process-Management-System zu kommunizieren. Als dritte Implementierungsstufe stellen SiLA-kompatible Laborgeräte ihren eigenen Webservice für eine direkte Kommunikation mit dem Process-Management-System zur Verfügung. Diese verschiedenen Implementierungsebenen helfen nicht nur dabei, neue Geräte kompatibel zu machen, sondern auch bereits im Labor installierte Geräte an die IT-Infrastruktur im Labor anzubinden.

Bedarf nach einheitlichem Protokollstandard

Eine Anbindung von Laborgeräten z.B. an ein Digitales Laborbuch oder ein LIMS ist in vielen Fällen bereits möglich, oft jedoch müssen dazu aufwändige und kostspielige Insellösungen entwickelt werden. Ansätze, die eine Plug-and-Play-Anbindung von Laborgeräten erlauben, sind allerdings keine allzu ferne Zukunftsmusik mehr. Die Integration eines SiLA-kompatiblen Prozess-Management-Systems in ein digitales Laborbuch, wie es beispielsweise gerade in einer Zusammenarbeit des Fraunhofer-Institutes für Produktionstechnik und Automatisierung IPA mit dem Unternehmen Labfolder entwickelt wird, kann die routinemäßige Anbindung einer großen Zahl von Laborgeräten stark vereinfachen.

Der nächste notwendige Schritt besteht in der Entwicklung eines einheitlichen Protokollstandards, der es erlaubt, Messungen aus Geräten und Eintragungen im digitalen Laborbuch in einen größeren Zusammenhang zu bringen. Das Ziel dieses Standards muss es sein, eine Infrastruktur bereitzustellen, in der Daten so abgelegt werden können, dass sie den Blick auf größeres freiwerden lassen. Wenn erst einmal Daten aus vergangenen Prozessen automatisch für die Optimierung von neuen Prozessen verwendet werden können – dann ist die Vision des integrierten und flexiblen Labors greifbar und die Versprechungen von Big-Data-Anwendungen können Realität werden.

* Dr. F. Hauer: Labfolder GmbH, 10119 Berlin, Tel. +49-30-91572642

* *Dr. M. Koch: Fraunhofer-Institut für Produktionstechnik und Automatisierung IPA, 70569 Stuttgart

(ID:42951840)