EMBL-EBI Forscher entwickeln Verfahren zur Speicherung auf DNA

Forscher am EMBL-European Bioinformatics Institute (EMBL-EBI) haben eine Methode entwickelt, Daten in der Form von DNA zu speichern - einem extrem langlebigen Material, das mehrere zehntausend Jahre überdauern kann. Diese neue Methode, die heute in der Fachzeitschrift Nature vorgestellt wird, ermöglicht die Speicherung von mindestens 100 Millionen Stunden hochauflösendem Videofilm in einer Menge DNA, die in eine Kaffeetasse passt.

Die Menge an digitaler Information weltweit entspricht momentan ungefähr drei Zettabyte (zum Vergleich: 1 Zettabyte entspricht einer 1 mit 21 Nullen) und der immerwährende Zuwachs an neuen digitalen Inhalten stellt die Archivare vor große Herausforderungen. Festplatten sind teuer und benötigen eine ununterbrochene Stromversorgung, während sogar die besten stromunabhängigen Archivierungsmaterialien wie zum Beispiel Magnetbänder innerhalb von zehn Jahren zerfallen. Dies ist vor allem für die Lebenswissenschaften zunehmend ein Problem, denn die Speicherung riesiger Datenvolumen - einschließlich DNA-Sequenzen - macht einen wesentlichen Teil des wissenschaftlichen Datenbestandes aus.

"Wir wissen bereits, dass DNA ein äußerst robustes Speichermedium ist, denn wir können sie aus den Knochen des Wollmammuts extrahieren, die mehrere zehntausend Jahre alt sind und sie enthält immer noch sinnvolle Informationen," erläutert Nick Goldman vom EMBL-EBI. "Außerdem ist sie unglaublich winzig und besitzt eine hohe Dichte. Und sie braucht zur Speicherung keine Energie, was Transport und Lagerung natürlich stark vereinfacht."

Das Lesen von DNA ist relativ unkompliziert, bisher war es das Schreiben, das dieser Speichermethode im Weg stand. Denn dabei gibt es zwei Herausforderungen: zunächst einmal erlauben die derzeitigen Methoden lediglich eine Herstellung von kurzen DNA-Strängen und zweitens sind sowohl das Lesen als auch das Schreiben fehleranfällig, besonders dann, wenn sich ein Buchstabe in der DNA wiederholt. Nick und sein Mitautor Ewan Birney, stellvertretender Direktor am EMBL-EBI, machten sich also daran, einen Code zu entwickeln, der beide Probleme angeht.

"Wir waren uns bewusst, dass wir für unseren Code lediglich kurze DNA-Stränge verwenden durften.

Außerdem musste er so beschaffen sein, dass eine Wiederholung desselben Buchstabens praktisch ausgeschlossen war. Deshalb kamen wir auf die Idee, den Code in eine Reihe sich überlappender Fragmente aufzubrechen, die sich in beide Richtungen erstrecken. Positionsinformation zeigen an, wo das jeweilige Fragment im Code seinen Platz hat. So entsteht eine Kodierung, die keine Wiederholungen zulässt. Das heißt, derselbe Fehler müsste in vier verschiedenen Fragmenten auftreten, um wirklich Schaden anzurichten - und dies ist extrem selten, " sagt Ewan Birney.

Die neue Methode erfordert eine Synthetisierung von DNA aus der verschlüsselten Information. Dies rief das kalifornische Unternehmen Agilent Technologies Inc. auf den Plan, das seine Unterstützung anbot. Daraufhin schickten Ewan Birney und Nick Goldman verschlüsselte Versionen von folgenden Dateien nach Kalifornien: eine .mp3-Version von Martin Luther Kings Rede "I have a dream", eine .jpg-Aufnahme des EMBL-EBI, eine .pdf-Datei mit Watson und Cricks bahnbrechender Veröffentlichung "Molecular structure of nucleic acids" sowie eine .txt-Datei mit den Sonetten Shakespeares. Ergänzt wurde dies von einer Datei, in der die Verschlüsselung beschrieben wird.

"Wir haben die Dateien aus dem Web heruntergeladen und damit mehrere hunderttausend DNA-Teilchen synthetisiert - das Ergebnis sieht aus wie eine winzige Menge Staub," erklärt Emily Leproust von Agilent. Agilent schickte die Probe ans EMBL-EBI, wo es den Wissenschaftlern gelang, die DNA zu sequenzieren und die Dateien fehlerfrei zu dekodieren.

"Wir haben einen fehlertoleranten Code entwickelt, der sich einer molekularen Form bedient, von der wir wissen, dass sie unter günstigen Bedingungen 10 000 Jahre oder länger halten kann", so Nick Goldman. "Solange es jemanden gibt, der den Code kennt, wird man ihn lesen können - falls man im Besitz einer Maschine ist, die DNA lesen kann."

Obwohl es noch eine Reihe praktischer Probleme zu lösen gibt, gilt die DNA aufgrund ihrer Dichte und Langlebigkeit bereits jetzt als attraktives Speichermedium. Der nächste Schritt wird nun sein, die Kodierung zu perfektionieren und die praktischen Probleme zu lösen, um das DNA-Speichermodell wirtschaftlich rentabel zu machen.

Originalliteratur:
Nick Goldman, Paul Bertone, Siyuan Chen, Christophe Dessimoz, Emily M. LeProust, Botond Sipos & Ewan Birney: Towards practical, high-capacity, low-maintenance information storage in synthesized DNA. Advanced online publication in Nature on 23 January, 2013 - DOI:10.1038/nature11875

http://www.embl.de/

 

Jetzt registrieren!

Die neusten Informationen direkt per Newsletter.

To prevent automated spam submissions leave this field empty.