"Entschuldigung, leider ist meine Hausarbeit mutiert"

Japanische Forscher nutzen bakterielle Gensequenzen als Datenspeicher. Die Technik eröffnet ganz neue Perpektiven: Lagern wir unsere MP3-Sammlung demnächst im Joghurtbecher?

Der folgende Beitrag ist vor 2021 erschienen. Unsere Redaktion hat seither ein neues Leitbild und redaktionelle Standards. Weitere Informationen finden Sie hier.

Es hat ja mal wieder lange gedauert: Über Jahrmilliarden hat uns die Natur vorgeführt, wie man mit vier Datenbits, vier Buchstaben, komplexe Baupläne auf sichere und dauerhafte Weise speichert. Die DNS, ihr Datenspeicher, ist einerseits vielfach redundant, weil in jeder Körperzelle vorhanden. Andererseits verfügt die Natur über eine beinahe perfekte Fehlerkorrektur - und zwar in Form der Evolution: Tritt doch einmal ein Fehler in den Daten auf, ist das daraus konstruierte Wesen mit höchster Wahrscheinlichkeit nicht lebens- oder fortpflanzungsfähig. Nur ganz selten tritt der unwahrscheinliche Fall auf, dass das fehlerhafte Ergebnis in Wirklichkeit die gespeicherten Daten optimiert. Dann erklärt die Natur ganz großzügig die neue Version zur wahren.

Was so lange funktioniert hat, muss ja irgendwelche Vorteile haben, mögen sich Forscher der Keio-University - eine der ältesten Privat-Hochschulen Japans - gedacht haben: Wie sie berichten, gelang es ihnen, Gen-Informationen von Bakterien als Datenspeicher zu nutzen. Die Idee ist nicht ganz neu - DNS wurde zum Beispiel schon als steganografisches Hilfsmittel zum Verstecken von Nachrichten vorgeschlagen und als Träger für Signaturen.

Selbst der Fehlerkorrektur hat sich die Forschung schon gewidmet - denn Gendaten sind leider vielfältigen chemischen Einflüssen ausgesetzt. Sie können sich beim Speichern oder Auslesen ändern, aber auch durch natürliche Evolution. Die Keio-Forscher schlagen vor, auf komplizierte Kodierungsverfahren zu verzichten - und stattdessen die zu speichernden Daten einfach mehrfach unterzubringen. Zum Auslesen muss man dann nur das komplette Genmaterial sequenzieren und nach identischen Regionen suchen.

Bacillus subitilis unter dem Mikroskop

Zur praktischen Umsetzung haben sich die Wissenschaftler ein recht gewöhnliches Bakterium ausgesucht, das in den oberen Schichten des Erdbodens lebende, stäbchenförmige Bacillus subtilis. Das ist vermutlich kein Zufall, denn eine Unterart des Fäulnisbakteriums wird zur Zubereitung des traditionellen japanischen Lebensmittels Natto verwendet. B. subtilis ist recht robust - eine gute Voraussetzung für einen dauerhaften Datenspeicher.

Die Forscher wählten die Sequenz „E=mc^2 1905!“ als Datengrundlage - und zwar in Form von Tastatur-Scancodes. Diese brachten sie in Binärdarstellung, um schließlich jedem von 16 möglichen Vier-Bit-Nybbles nach einer Tabelle eine zweibuchstabige DNS-Codesequenz (AA, CA, TC…) zuzuordnen. Über eine simple Bitverschiebung konstruierten die Wissenschaftler daraus vier verschiedene Sequenzen, die sie an unterschiedlichen Stellen im B.-subtilis-Genom unterbrachten. Wie stabil sie ihre Daten damit unterbrachten, ermittelten die Forscher mit Hilfe einer Computersimulation, die unter anderem unerwünschte Mutationen und Löschungen mit einbezog. Wenn die Mutations-/Löschrate unter 15 Prozent lag, ließen sich demnach noch 99 Prozent der Daten rekonstruieren.

Problematisch ist, das geben die Wissenschaftler zu, momentan noch die Lesegeschwindigkeit für ihr Speicherverfahren: Um ein komplettes Bakteriengenom mit rund zwei Millionen Basenpaaren zu sequenzieren (was hier Voraussetzung ist), braucht aktuelle Technik rund 24 Stunden. Die Wissenschaftler schätzen allerdings, dass sich in nicht allzu ferner Zukunft eine Million Basenpaare pro Sekunde auslesen lassen.

Auf slashdot.org, wo eine Kurzversion der Geschichte die Runde machte, diskutierten die Fans bereits mögliche Szenarien der Datenspeicherung in DNS:

He. Kumpel, ich war so hungrig, dass ich mir einen Joghurt genehmigt habe

Mensch, du hast gerade meine Pornosammlung aufgegessen.

Um die neue Version einer Linux-Distribution unter die Leute zu bringen, bräuchte man nur noch die nächste Grippewelle abzuwarten. Schülern ermöglicht das Verfahren ganz neue Ausreden: „Leider ist die Sicherheitskopie meiner Hausarbeit mutiert“.

Bleibt nur noch eine letzte, nicht übersetzbare Frage: „Is there a bug in my program - or is there a program in my bug?“ Und wer weiß, ob nicht schon längst jemand unsere DNS als Datenspeicher einsetzt - und wir nur noch nicht in der Lage waren, die Verschlüsselung zu knacken…