Suchen

Datenstandards und Cloudtechnologie

Offenheit von Daten dank AnIML

| Autor/ Redakteur: Burkhard Schäfer* / Christian Lüttmann

Der Trend geht zum papierlosen Labor. Die dort entstehenden Daten sollen nachhaltig verwaltet werden, stellen sie doch einen großen Wert für ein Unternehmen dar. Dabei gilt es, die Zugänglichkeit und Wiederverwendbarkeit der Daten sicherzustellen. Standards wie AnIML sowie Cloudtechnologie helfen dabei. Erfahren Sie hier, wie Scientific Data Management Systeme den Umgang mit wissenschaftlichen Daten optimieren.

Firmen zum Thema

Abb.1: Ein Scientific Data Management System mit AnIML bietet einige Vorteile (Symbolbild).
Abb.1: Ein Scientific Data Management System mit AnIML bietet einige Vorteile (Symbolbild).
(Bild: ©WrightStudio - stock.adobe.com)

Jeder produziert im Laufe seines Lebens eine schier unfassbare Menge an Daten im Labor. Doch ohne ein System, dass die Daten geordnet und mit dem nötigen Kontext hinterlegt, verkommen sie mitunter zu unbrauchbarem Ballast auf der Festplatte. In den vergangenen Jahren hat sich daher der Ansatz bewährt, die von Messgeräten produzierten Daten zusammenzuführen und zentral zu verwalten. Ein Scientific Data Management System (SDMS) übernimmt diese Aufgabe. Dabei sammelt ein auf dem Geräte-PC installierter Softwareagent neu erstellte Dateien ein und überträgt sie auf den SDMS-Server. Der Server legt die Daten versioniert ab und verwaltet einen Audit Trail. Weiterhin steht eine Oberfläche bereit, mit der Anwender die gespeicherten Daten leicht wieder auffinden und herunterladen können.

Dieser Ansatz ist durchaus sinnvoll: Man sammelt die Daten sobald wie möglich von den Geräte-PCs ein und verwahrt sie in einer kontrollierten Umgebung. Durch Zugangskontrolle, Audit Trails und Versionierung können regulatorische Vorgaben auch bei dezentraler Speicherung erfüllt werden.

Die Anforderungen im Labor unterliegen jedoch einem Wandel. Neue Technologieansätze laden ein, die Strategie für Datenmanagement zu hinterfragen und anzupassen, um eine zukunftsträchtige Infrastruktur bereitzustellen. Wir betrachten im Folgenden die Aspekte der Skalierbarkeit und Bereitstellung, Zugänglichkeit der Daten sowie Möglichkeiten zur Auswertung.

Cloud-Systeme: Kapazität nach Bedarf

In der Praxis kommen gerade bei umfangreichen Installationen Bedenken auf, dass klassische SDMS-Ansätze bei großen Datenmengen an ihre Grenzen stoßen. Bei kleinen wie großen Installationen ist es wichtig, die notwendige Kapazität bedarfsgerecht bereitstellen zu können. In der Vergangenheit waren solche Systeme noch eher monolithisch aufgesetzt: Alle Last lag auf nur einem oder wenigen Servern. Heute setzt man vermehrt auf verteilte Systeme, die bedarfsgerecht skalieren. Hierbei helfen Mikroservice-orientierte Ansätze. Man verteilt die Last auf viele kleine Dienste, die jeweils eine genau umrissene Aufgabe haben. Diese Dienste lassen sich individuell skalieren, um Flaschenhälse punktgenau zu adressieren. So lassen sich sowohl Speicher- als auch Rechenkapazität variabel anpassen und es kommt nicht zu Leistungseinbrüchen.

Bei On-Premise-Lösungen, bei denen die Systeme vor Ort beim Anwender im Rechenzentrum betrieben werden, tendiert man dazu, das System für die maximal zu erwartende Last zu dimensionieren. Dabei ist die bereitgestellte Kapazität oft überdimensioniert und wird nur selten bei Lastspitzen benötigt. Die Cloud bietet hier einen elastischen Ansatz, wo die genannten Services im Bedarfsfall problemlos mit weiterer Kapazität ergänzt werden können. Ist die Lastspitze vorbei, kann die Infrastruktur wieder reduziert werden. Gerade diese Elastizität sorgt für Kostenersparnis. Bei dem Unternehmen BSSN Software hat sich diese Technologie bewährt, um Kundensysteme effizient zu betreiben.

Ein wahres Tier der Datenspeicherung: AnIML

Klassische Ansätze legen Gerätedaten im Originalformat auf einem Server ab. Dies bedeutet, dass zum Lesen der Daten i.d.R. die Originalsoftware des Geräts erforderlich ist. Entsprechende Lizenzen müssen für jeden Anwender, der diese Daten nutzen soll, vorhanden sein. Dies sorgt für hohen Verwaltungsaufwand und ist nicht immer praktikabel. Zudem besteht die Gefahr, dass alte archivierte Daten unlesbar werden, wenn der Software-Support irgendwann eingestellt wird und kein „Reader“ mehr für die proprietären Originaldaten verfügbar ist.

Um diese Herausforderung zu lösen, bietet sich die Ablage der Daten in offenen Standardformaten wie AnIML an. AnIML, kurz für Analytical Information Markup Language, ist ein XML-basierendes Datenformat für analytische und biologische Daten. Es wurde durch eine Arbeitsgruppe bei der internationalen Standardisierungsorganisation ASTM entwickelt und setzt sich bei den Laborinformatikherstellern mehr und mehr durch. Wer ein Format wie AnIML nutzt, benötigt nur noch ein einziges Werkzeug, um die Daten verschiedenster Messtechniken und Hersteller darzustellen. Dies führt zu interessanten Synergien. Inzwischen sind fertige Konverter verfügbar, mit denen sich die Daten von über 200 Gerätemodellen in das AnIML-Format überführen lassen. Auch einige Gerätehersteller haben diese Chance bereits für sich erkannt und stellen solche Konverter bereit.

Zugänglichkeit über alle Formate hinweg sichern

Abb.2: Gespeicherte Daten im XML-Format lassen sich geräteunabhängig auslesen (Symbolbild).
Abb.2: Gespeicherte Daten im XML-Format lassen sich geräteunabhängig auslesen (Symbolbild).
(Bild: ©envfx - stock.adobe.com)

Es hat sich bewährt, Daten sowohl im Originalformat als auch im AnIML-Format im Repository abzulegen, einem Verzeichnis, das die Daten mitsamt aller Metadaten und früheren Versionen speichert. Die Originaldaten lassen sich bei Bedarf auf den Geräterechner zurückspielen und in der Gerätesoftware öffnen und prozessieren. Die AnIML-Daten sind deutlich zugänglicher und können auch von anderen Applikation problemlos dargestellt und verarbeitet werden. Es stehen Viewer für Windows, Mac OS, Webbrowser, Android und iOS zur Verfügung.

Durch die Wahl von XML als Basistechnologie sind AnIML-Daten leicht lesbar. XML-Funktionalität gehört heute zum guten Ton. So sind tausende Werkzeuge nutzbar, um die Labordaten auszulesen – sogar wenn diese Werkzeuge ursprünglich überhaupt nicht für die Laborwelt gedacht waren. Man ist nicht mehr auf proprietäre Bibliotheken angewiesen, um die Daten zu lesen, weil diese nicht mehr nur in ihrem originalen Speicherformat vorliegen. Dies spart bares Geld und sorgt so für geringere Gesamtkosten.

Die Nutzung von AnIML ermöglicht auch einen vereinfachten Austausch von Daten mit Partnern innerhalb und außerhalb der eigenen Organisation. Bei der Zusammenarbeit mit Auftragslabors oder -forschungseinrichtungen können durch AnIML die Daten in ähnlicher Qualität übertragen werden wie bei Inhouse-Messungen. Die gleichen AnIML-Daten lassen sich an ein LIMS- oder ELN-System weitergeben, um eine effiziente Geräteanbindung zu realisieren. In diesem Zusammenhang ist auch die Arbeit des SiLA-Konsortiums von Interesse, wo ein dazu passendes Kommunikationsprotokoll geschaffen wurde.

Am 22. und 23. Oktober 2019 findet in Jülich das LIMS-Forum von Klinkner und Partner statt. Dort erwarten Sie u.a. ein Vortrag zum Thema „Offene Standards – LIMS-Compliance und Datenintegrität mit SiLA und AnIML“ sowie Vertreter von BSSN und anderen Software- und LIMS-Anbietern.

Visualisierungstools zur Datenauswertung

Mit der Zeit wird sich in einem Datenmanagementsystem eine große Menge von Daten ansammeln, die wertvolle Informationen enthalten. Daher bietet es sich an, diese Daten für Auswertungen zu nutzen. So lassen sich Trends erkennen und Fragen beantworten, die zum Zeitpunkt einer Analyse noch gar nicht bekannt waren. Aus solchen Informationen lassen sich neue Einsichten gewinnen und Prozesse verbessern.

Um dies zu ermöglichen, sehen moderne Systeme eine Auswertungsschicht vor, die Daten aus AnIML heraus extrahiert und in einer Metadatenschicht bereitstellt. Visualisierungstools bedienen sich nun an den Metadaten, um diese geeignet darzustellen, z.B. in Form eines Punktediagramms oder einer anderen graphischen Darstellungsform. Diese Metadaten lassen sich nun auch zur Navigation der Datenbasis nutzen. Die Metadaten lassen sich über Drittsysteme weiter anreichern, um zusätzlichen Kontext um die Analytikdaten zu schaffen. So können User ihre Daten nach Studie, Substanz, Labor, Produkt, Projekt oder Kostenstelle navigieren und auswerten.

Fazit: Strukturierte Daten bereichern die Forschung

Wenn Daten besser zugänglich sind, werden sie auch mehr genutzt. Das Wissen, das sich in einer Organisation ansammelt, ist leichter verfügbar und sorgt für einen Mehrwert für jeden einzelnen Versuch. Standardformate wie AnIML sowie Cloudtechnologie können hierbei wertvolle Dienste leisten, Anwender beim Verwalten ihrer Daten zu unterstützen.

* B. Schäfer, BSSN Software GmbH, 64293 Darmstadt

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Kontaktieren Sie uns über: support.vogel.de (ID: 46045153)