English China

Biobasierte Speichermedien Daten in DNA gemeißelt

Das Gespräch führte Elke Oleson*

Anbieter zum Thema

Die zunehmende Digitalisierung unseres Lebens bringt enorme Datenmengen hervor – die (langfristig) gespeichert werden wollen. DNA ist das grundlegende Speichermedium schlechthin. Wie die Datenspeicherung mit ihrer Hilfe gelingt, erläutert unsere Expertin im LP-Exklusivinterview.

Prof. Dr. Lena Wiese, Professorin für Datenbanktechnologien und Data Analytics an der Goethe-Universität Frankfurt
Prof. Dr. Lena Wiese, Professorin für Datenbanktechnologien und Data Analytics an der Goethe-Universität Frankfurt
(Bild: Fraunhofer-Institut für Toxikologie und Experimentelle Medizin)

DNA als Massenspeicher der Zukunft – das klingt ein wenig nach Science Fiction. Frau Prof. Wiese, was genau kann man sich darunter vorstellen?

Prof Dr. Lena Wiese: Da in allen Lebens- und Arbeitsbereichen ein Schritt in Richtung Digitalisierung gegangen wird, entstehen immer größere Datensammlungen. Einige dieser Daten werden vielleicht irgendwann mal historischen Wert haben oder man möchte beispielsweise in höherem Alter im Krankheitsfall auf Labormesswerte zurückgreifen, die im Kindesalter erhoben wurden. Dafür brauchen wir ein Speichermedium, das auch langfristig unabhängig ist von der sich schnell entwickelnden Speichertechnologie; beispielsweise benutzt heutzutage niemand mehr Disketten – und auch CDs/DVDs sind weniger im Einsatz. Ein Ziel bei der Entwicklung eines biobasierten Speichermediums ist, dass die gespeicherten Daten auch noch nach etwa 100 Jahren (oder auch länger) vom Datenträger ausgelesen werden können. Die DNA – als das grundlegende Medium für die Speicherung der genomischen Information seit Jahrmillionen – ist in diesem Sinne unabhängig von schnelllebigen elektronischen Speichermedien, da eine Sequenzierung von DNA-Strängen inzwischen ein weitverbreitetes Standardverfahren ist.

Welche Daten lassen sich auf Erbgut-Biochips speichern, und was sind die Vorteile gegenüber üblichen Silizium-Chips?

Grundsätzlich lassen sich beliebige Daten in DNA speichern, solange eine entsprechende Übersetzungsmöglichkeit vorhanden ist. Für eine Umsetzung der Datenspeicherung in DNA werden daher Daten, die derzeit im Computer auf Festplatten gespeichert werden, übersetzt in Folgen von DNA-Nucleotiden. In den letzten Jahrzehnten wurden bereits mehrere Codierungsverfahren vorgeschlagen, um binäre Daten auf dem Computer (dargestellt als Bits) in DNA-Sequenzen zu übersetzen. Dabei ist zusätzlich zu beachten, dass eine Eingabedatei gegebenenfalls in mehrere DNA-Stränge übersetzt wird und zusätzliche Informationen (z. B. zur Fehlererkennung und -korrektur) abgebildet werden müssen, um die Daten korrekt rekonstruieren zu können. Die erzeugten DNA-Sequenzen müssen künstlich synthetisiert und dann entsprechend archiviert werden. Um Daten wieder auszulesen, werden die betreffenden DNA-Stränge wieder sequenziert und danach in die Ausgangsdatei zurückübersetzt.

Der Hauptvorteil der DNA als Speichermedium ist die hohe Speicherdichte, sodass sehr viel Information in einem kleineren Volumen als bisher untergebracht werden kann. Als Folge davon sinkt auch der Energieverbrauch für die Datenspeicherung, sodass DNA-Speicher zu nachhaltigeren, energieeffizienteren Rechenzentren beitragen können. Zudem gehen wir davon aus, dass der weltweite Rohstoffmangel den Chipmarkt negativ beeinflussen kann. DNA-Speicher haben in diesem Kontext dann den Vorteil eines geringeren mikroelektronischen Materialbedarfs.

Vier Fraunhofer-Institute (ITEM, FEP, IPMS und IZI-BB) arbeiten in einem gemeinsam Projekt mit Namen Biosynth daran, eine universelle Mikrochip-Plattform zum DNA-/ RNA-/Peptid-Schreiben zu entwickeln. Welche Faktoren werden hierbei beleuchtet, und worin liegen die Herausforderungen?

Generelles Ziel ist die Entwicklung einer neuartigen, biohybriden Mikrochip-Plattform für effiziente DNA-Speicher; damit wollen wir als langfristige Vision ermöglichen, dass der DNA-Speicher nahtlos an bestehende mikroelektronische Systeme angebunden werden kann.

Bisher ist die Synthetisierung (also das Schreiben) der DNA jedoch noch viel zu langsam, um Daten mit einem ausreichenden Durchsatz speichern zu können. In unserem Projekt wollen wir die Grundlagen für hochparallele Syntheseverfahren schaffen. Gleichzeitig wollen wir die Möglichkeiten für eine Miniaturisierung der Plattform ausloten. Zudem wollen wir den Tradeoff zwischen Fehlerfreiheit (Datenrekonstruktion) und Speicherdichte genauer analysieren und unsere Datenkodierungs­verfahren darauf anpassen. Als eher experimentellen Anteil wollen wir schließlich bisher nur wenig verbreitete Alternativen zu DNA (also etwa RNA oder Peptide) auf ihre Realisierbarkeit für Speichermedien untersuchen.

Für welche Anwendungen sind DNA-Massenspeicher am besten geeignet?

Die Mehrzahl der heutzutage generierten Daten sind so genannte ‚kalte‘ Daten, die im Wesentlichen nur archiviert werden und auf die vergleichsweise selten zugegriffen wird. DNA-Speicher sind als Speichermedium für solche Daten besonders geeignet, da sie in der Lage ist, die Daten sehr komprimiert über einen langen Zeitraum aufzubewahren. Öffentliche aber auch privatwirtschaftliche Archive, die langfristig vorzuhaltende Unterlagen oder historische Dokumente verwalten, sind daher der erste Zielmarkt für neue, parallelisierbare Speichertechnologien wie DNA-Speicher. Ein Auslesen der archivierten Daten durch Sequenzierung darf in diesem Anwendungsfall dann durchaus ein paar Stunden dauern, bevor die Daten zur Nutzung bereitgestellt werden.

Jetzt Newsletter abonnieren

Verpassen Sie nicht unsere besten Inhalte

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung.

Aufklappen für Details zu Ihrer Einwilligung

Um mittelfristig Realzeitanforderungen gerecht zu werden (z. B. als DNA-Festplatten im Laptop) bedarf es jedoch noch einiger technologischer Fortschritte, um eine Miniaturisierung und Effizienzsteigerung von Geräten für sowohl die Synthese (Schreiben) als auch die Sequenzierung (Lesen) zu erreichen.  (ott)

* E. Oleson, freie redaktionelle Mitarbeiterin bei LABORPRAXIS

Prof. Dr. Lena Wiese

Lena Wiese ist Professorin für Datenbanktechnologien und Data Analytics an der Goethe-Universität Frankfurt und zeitgleich Leiterin der Gruppe Bioinformatik am Fraunhofer-Institut für Toxikologie und Experimentelle Medizin. Nach ihrer Promotion in Informatik an der TU Dortmund war sie als Postdoktorandin am National Institute of Informatics (Tokio) sowie als Wissenschaftlerin an mehreren Universitäten im In- und Ausland (Hildesheim, Salzburg, Göttingen und Hannover) tätig. Ihre Forschungsinteressen sind effizientes und sicheres Datenmanagement. Ein Schwerpunkt liegt dabei auf biomedizinischen Informationssystemen und auf der Analyse multimodaler medizinischer Daten mit maschinellem Lernen. Im Projekt Biosynth entwickelt die Gruppe Bioinformatik die Software zur Datenkodierung und Datenrekonstruktion.

(ID:48763591)