DNA-Chips Speichern und Rechnen im Code der Natur

Von Filipe Pereira Martins und Anna Kobylinska 9 min Lesedauer

Da konventionelle Ansätze an die Grenzen der Physik stoßen, sind für die Datenflut der Zukunft Alternativen zu siliziumbasierten Chips gefragt. Anleihen beim Code des Lebens lassen auf einen Durchbruch hoffen. DNA macht ja schon seit geraumer Zeit als ein vielversprechender Rechenspeicher von sich reden.

Ein Team an der Julius-Maximilians-Universität (JMU) Würzburg entwickelt DNA-Chips aus halbleitender, bakterienproduzierter Nanocellulose.(Bild:  Lehrstuhl für Bioinformatik der Universität Würzburg)
Ein Team an der Julius-Maximilians-Universität (JMU) Würzburg entwickelt DNA-Chips aus halbleitender, bakterienproduzierter Nanocellulose.
(Bild: Lehrstuhl für Bioinformatik der Universität Würzburg)

Die Lösung für beschränkte Speicher- und energieintensive Rechenkapazitäten könnte in den Bausteinen des Lebens liegen: der DNA. Die quaternäre Codierung von DNA soll die erforderliche Speicherdichte und Robustheit für die anstehende Datenexplosion schaffen.

Hyper-dicht und mega-kompakt

Ein Gramm DNA könnte theoretisch bis zu einer Milliarde Gigabyte an Informationen erfassen. Das entspricht einer möglichen Datenspeicherkapazität von mehreren Exabytes pro Kubikmillimeter.

„Eine einzige Kaffeetasse voller DNA würde ausreichen, um sämtliche digitalen Daten der Menschheit aufzunehmen“, sagt Mark Bathe, Professor für biologische Ingenieurwissenschaften am MIT und assoziiertes Mitglied des Broad Institute von MIT und Harvard. Denn DNA ist „rund tausendmal dichter als selbst [modernste] Flash-Speicher“, enthüllt der Forscher.

Mindestens genauso wichtig sei aus seiner Sicht noch eine andere Eigenschaft von DNA als Speichermedium. Sobald man den DNA-Polymer hergestellt habe, verbrauche der Speicher keine Energie mehr. Man könne die DNA schreiben und dann für immer aufbewahren, so Prof. Bathe.

Bisher sind die Kosten dafür prohibitiv hoch.

Der DNA-Datenspeicherung liegt eine chemische Reaktion, die sogenannte DNA-Synthese, zu Grunde. Das Lesen erfordert die sogenannte Sequenzierung, ein Verfahren zum Bestimmen der genauen Reihenfolge der Nukleotide in einem vorhandenen DNA-Strang. Beides ist ein langwieriger Laborprozess. Praktische Anwendung ist nicht zuletzt auch durch sehr langsame Lese- und Schreibzeiten begrenzt. Um den Ablauf der Prozedur zu beschleunigen, experimentieren Forscher mit modifizierten Ansätzen (siehe Abschnitt „NAM-hafter Nukleinsäure-Speicher“).

Microsoft und University of Washington haben mit diesem automatischen – und bereits historischen – System vor rund sechs Jahren den Ablauf der Datenarchivierung in DNA demonstriert.(Bild:  Microsoft)
Microsoft und University of Washington haben mit diesem automatischen – und bereits historischen – System vor rund sechs Jahren den Ablauf der Datenarchivierung in DNA demonstriert.
(Bild: Microsoft)

Die molekulare Form der DNA ähnelt einer Doppelhelix aus zwei antiparallelen, komplementären Strängen. Die beiden Stränge verfügen über ein Phosphat-Zucker-Gerüst. Innerhalb dieser Stränge befinden sich stickstoffhaltige Basen, die wie horizontale Sprossen geformt und übereinandergestapelt sind: Adenin (A), Thymin (T), Guanin (G) und Cytosin. Mit diesen Basen (ATCG statt Nullen und Einsen) ließen sich die Zahlenpaare 00, 01, 10 und 11 als A, T, C und G codieren.

Konventionelle Computer, die sich binäre Datencodierung zu Nutze machen, hantieren mit einer Abfolge von Nullen und Einsen. Diese zwei Werte werden durch unterschiedliche Zustände von Elektronen in einem Speichermedium dargestellt (entweder „an“ oder „aus“), zum Beispiel durch die Ausrichtung magnetischer Partikel auf einer Festplatte oder durch geladene und ungeladene Zustände in einem Halbleiter. Diese Zustände sind bekannterweise störungsempfindlich, anfällig für physikalische Defekte, elektromagnetische Felder und den normalen Alterungsprozess. Der Ansatz hat keine inhärente Fehlerkorrektur – im Gegensatz zu DNA-Code.

Die Basenpaare der DNA sind komplementär: Adenin paart sich mit Thymin; Guanin mit Cytosin. Jeder der beiden DNA-Stränge ist somit eine vollständige Datenreplika des anderen. Diese molekulare Konstruktion von DNA ist extrem widerstandsfähig und hat niedrige Energieanforderungen, selbst bei Schreib- und Lesevorgängen. Sie kann sich regenerieren. Sie kann sich replizieren und ist nebenbei vollständig recyclebar.

Die binäre Codierung, die in der Informationstechnik Einsatz findet, ist allerdings leichter zu handhaben, da sie sich direkt von der Funktionsweise elektronischer Schaltkreise ableitet. Unter optimalen Bedingungen bleibt die Integrität des DNA-Code über Tausende von Jahren intakt.

Ausgerechnet in DNA

DNA-Computing will die Informationsverarbeitung mit synthetischen DNA-Molekülen bewältigen. Auch dieses aufstrebende Forschungsgebiet hat kürzlich einige beachtliche Fortschritte erzielt, allerdings vorrangig in medizinischen Anwendungen.

In konventionellen Silizium-basierten integrierten Schaltungen fließen binär codierte Informationen durch kontrollierte Elektronenbewegungen entlang metallisierter Leiterbahnen. Die Signale passieren logische Gatter aus CMOS-Transistorpaaren, die sich zu komplexen Logiknetzwerken zusammensetzen, viel Energie verschlingen und Wärme abgeben. Photonische Chips (siehe dazu den Bericht „Unter der Haube des photonischen KI-Beschleunigers von Q.ANT“), eine vielversprechende Alternative, ersetzen Elektronen durch Photonen; sie hantieren mit Lichtsignalen und machen sich Effekte wie das Wellenlängenmultiplexing für native Parallelität zu Nutze. Was macht DNA-Computing anders?

Wissen, was läuft

Täglich die wichtigsten Infos aus dem ITK-Markt

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung

DNA-basierte Informationssysteme stützen sich auf die biomolekulare Datenverarbeitung — sprich: auf biochemische Reaktionen. Das Highlight ist die massive Parallelität dieser aufkommenden Lösungen bei einer unübertroffenen Speicherdichte. Ein Milliliter DNA-Lösung kann ≈10¹⁸ parallele DNA-Operationen durchführen; ein Gramm DNA erfasst theoretisch 455 Exabyte an Daten.

DNA-Lösungen (jetzt im doppelten Sinne) können konventionelle Silizium-basierte Schaltkreise in Nischenanwendungen ergänzen oder ersetzen — dort nämlich, wo es auf extreme Parallelität, unübertroffene Energieeffizienz des Speichers und eine Leistungsdichte der Extraklasse ankommt.

Anwendungen von DNA-Computing reichen von molekularen Schaltkreisen für Berechnungsprobleme mit NP-schwerer Komplexität bis hin zu Netzwerkflussalgorithmen mit linearer Zeitkomplexität. Limitationen liegen in der langsamen Ausführungsgeschwindigkeit biochemischer Prozesse und in den besonderen Anforderungen der Handhabung von DNA.

DNA-Computer machen sich die Bindungsfähigkeit der Basenpaare zu Nutze (Adenin paart sich mit Thymin, und Cytosin mit Guanin.) Ein kurzer Strang, der aus ATCG besteht, würde sich an TAGC binden und nicht an andere Sequenzen.

Mischt man DNA-Moleküle mit speziell entworfenen Sequenzen von Basen, kann man von diesem Verhalten Logikgatter ableiten. So kann DNA durch die geschickte Kombination von Basenpaaren als biologisches Logikgatter fungieren. Zum Beispiel:

  • Adenin (A) und Thymin: ein UND-Gatter,
  • Cytosin (C) und Guanin (G): ein ODER-Gatter,
  • die **NICHT-Funktion** ließe sich durch die Abwesenheit eines bestimmten Basenpaars implementieren.

Ein entscheidendes Hindernis auf dem Weg hin zur breiten Adoption stellt die Entwicklung programmierbarer Arrays von Logikgattern dar (siehe dazu den Abschnitt „D(NA)PGAs“).

„NAM-hafter“ Nukleinsäure-Speicher

„Die Natur betreibt Datenkompression in einem erstaunlichen Ausmaß und auf eine Art und Weise, die wir immer noch nicht vollständig verstanden haben“, beobachtet Gurtej Sandhu, Principal Fellow und Vizepräsident bei dem Speicherspezialisten Micron Technology aus Boise im U.S.-Bundesstaat Idaho.

Ein vielversprechender Kandidat für die DNA-basierte Datenspeicherung ist ein Ansatz namens dNAM (Digitaler Nukleinsäure-Speicher), der sich eine künstliche Nukleinbase zu Nutze macht. Das Verfahren codiert digitale Information in spezifischen Kombinationen von einzelsträngiger DNA (sogenannten „Staple-Strängen”) mit (1) oder ohne (0) Docking-Platz-Domänen auf DNA-Origami-Steckbrettern. Diese Staple-Stränge können sich mit einem Träger-DNA-Strang eigenständig zu DNA-Origami-Strukturen zusammenfügen — und sind wiederverwendbar.

Der erste dNAM-Prototyp mit DNA-Origami und DNA-PAINT-Super-Resolution-Mikroskopie entstand an der Universität Boise im ansonsten verschlafenen U.S.-Bundesstaat Idaho in Zusammenarbeit mit Micron Technology eben.

Einer von vielen Ansätzen zur Datenspeicherung in DNA(Bild:  Boise State University)
Einer von vielen Ansätzen zur Datenspeicherung in DNA
(Bild: Boise State University)

Ein funktionierender dNAM-Prototyp kodierte erfolgreich die Nachricht "Data is in our DNA!\n" mittels DNA-Origami und rekonstruierte sie mithilfe von DNA-PAINT-Super-Resolution-Mikroskopie.

Hierzu wurden die Daten zuerst in eine binäre Zeichenfolge umgewandelt und dann in Lokalisierungspunkte auf der Matrix kodiert. Die Matrixentwürfe werden dann auf DNA-Origami-Plattformen zusammengebaut. Diese Plattformen bestehen aus Stapelsträngen, die sich mit Hilfe von Träger-DNA eigentätig zusammenfügen.

Um die in Origami kodierte Information auszulesen, untersucht ein Gerät die Bindung von fluoreszierenden Bildgebungsproben mit Hilfe der DNA-PAINT-Super-Resolution-Mikroskopie. Diese Prozedur ermöglicht die Identifizierung der einzelnen „Stifte“ (Stapelfäden) in jeder Matrixzelle als 0 oder 1. Die Datendichte beträgt derzeit etwa 330 Gbit/cm².

Die Bilder der Muster werden durch einen Fehlerkorrekturalgorithmus nachbearbeitet, um eine 100%ige Wiederherstellung der ursprünglichen Nachricht zu ermöglichen. Sollten einzelne Docking-Plätze oder ganze Origami fehlen, lassen sich die Daten durch einen Fehlerkorrekturalgorithmus vollständig wiederherstellen. Im Gegensatz zu anderen Ansätzen zur DNA-basierten Datenspeicherung entfällt hierbei die DNA-Sequenzierung.

DNA-Speicherchips aus Würzburg

Die Forschung des Teams um Professor Thomas Dandekar an der Julius-Maximilians-Universität (JMU) Würzburg fokussiert auf DNA-basierte Datenspeicherung mit Chips aus halbleitender, bakteriell hergestellter Nanozellulose. Sie ist nicht bloß wiederverwendbar, sie ist biologisch abbaubar. Zum Auslesen der Daten dienen den Forschenden fluoreszenzbasierte Methoden (DNA-PAINT-Mikroskopie) und lichtgesteuerte Proteine.

DNA-Chips aus Würzburg erreichen eine Speicherdichte von bis zu einer Milliarde Gigabyte pro Gramm DNA und sind robust gegenüber elektromagnetischen Impulsen. Die DNA benötigt keine kontinuierliche Energiezufuhr. Die Forscher gehen davon aus, dass die so archivierten Informationen auf einem DNA-Chip mehrere tausend Jahre erhalten bleiben dürften.

D(NA)PGAs

Forschungsgruppen haben auch schon bereits erste DNA-basierte programmierbare Gate-Arrays (DNA-based Programmable Gate Arrays) für die allgemeine DNA-Berechnung entwickelt.

Das Konzept macht Anleihen bei klassischen FPGAs (Field Programmable Gate Arrays), realisiert jedoch Verarbeitungseinheiten mit DNA-Bausteinen auf molekularer Ebene. Klassische FPGAs bestehen aus rekonfigurierbaren Logikblöcken auf Siliziumbasis. DPGAs machen sich stattdessen DNA-Strukturen zu Nutze, die auf Hybridisierung, Polymerase-Reaktionen oder Enzym-gesteuerte Schnitte und Verbindungen setzen.

Ein Superchip mit über 100 Milliarden einzigartiger Schaltkreise? Sicher doch, in DNA ist es möglich und in der Natur die normalste Sache der Welt.

DNA-Moleküle können im Wesentlichen in beliebige Richtungen fließen. Dies erschwert das Zusammenführen von Logikgattern für Berechnungen in programmierten Sequenzen und stellt ein wesentliches Hindernis für DNA-Computing dar.

Um dieses Problem zu überwinden, setzen Forscher DNA-Origami ein. Dieser Ansatz nutzt die Fähigkeit einer DNA-Sequenz, an sich selbst zu haften und sich hierbei in nahezu jede gewünschte 2D- oder 3D-Form zu biegen.

In den DNA-Computern bewegen sich Oligonukleotide (kurze DNA-Segmente) in Teströhrchen ähnlich wie Elektronen in herkömmlichen Computern. Da sich jede DNA-Basis an ihr spezifisches Gegenstück bindet, kann sich ein loser DNA-Strand in sich falten und zusammenhalten – darum die Bezeichnung DNA-Origami.

In der molekularen Informationstechnologie spielt DNA-Origami eine Schlüsselrolle als strukturgebende Methode, um nanoskalige Rechenelemente zu organisieren – vergleichbar mit der Art und Weise, wie Register in konventionellen Siliziumprozessoren zum Einsatz kommen. Doch während Register Bits speichern, repräsentieren die DNA-Stränge (oder konjugierte Moleküle) logische Zustände. Der Zugriff erfolgt über eine molekulare Adresse, zum Beispiel auf der Grundlage der Sequenzkomplementarität.

DNA-Origami-Strukturen können etwa mehrere DNA-Gates (logische Gatter) und Schaltlogik integrieren. Sie schalten enzym- oder temperaturgesteuert. In diesen Systemen übernimmt das DNA-Origami nicht nur die physische Anordnung, sondern auch die logische Kopplung der „Registerzellen“ – also jener Moleküle, die den Speicherzustand tragen.

Ein Projekt der ETH Zürich und der University of Oxford kombinierte DNA-Origami mit Fluoreszenzmarkern, um binäre Zustände (0/1) optisch lesbar zu machen. Durch gezielte Zugabe von DNA-Schlüsselsequenzen ließ sich der Zustand einzelner Registerzellen aktiv ändern – vergleichbar mit dem Setzen oder Zurücksetzen eines Bits.

Mit Schwung zur Sache: Forscher der Harvard-Universität haben eine DNA-Speichermethode auf Basis enzymatischer DNA-Synthese entwickelt.(Bild:  Wyss-Institut an der Harvard-Universität)
Mit Schwung zur Sache: Forscher der Harvard-Universität haben eine DNA-Speichermethode auf Basis enzymatischer DNA-Synthese entwickelt.
(Bild: Wyss-Institut an der Harvard-Universität)

Integration von Elektronik und Photonik auf DNA-Chips

Forschende der ETH-Zürich haben elektronische und photonische Bauelemente auf einem einzigen Chip vereint. Durch den Einsatz von Plasmonik zwangen sie Lichtwellen in extrem kleine Strukturen, was die Miniaturisierung und Geschwindigkeit von DNA-Chips deutlich steigert. Diese Technologie ermöglicht schnellere und effizientere Datenübertragung und -verarbeitung. Dies verspricht Vorteile für die Analyse großer genomischer Datensätze, möglicherweise in-vivo.

Erster DNA-Rechenspeicher

Forschende der North Carolina State University und der Johns Hopkins University haben eine DNA-Technologie entwickelt, die eine ganze Reihe von Funktionen zur Datenspeicherung und -verarbeitung vereint, darunter wiederholtes Speichern, Abrufen, Rechnen, Löschen und Überschreiben von Daten.

Frühere DNA-basierte Speicher- und Rechentechnologien konnten nur einzelne dieser Aufgaben ausführen, jedoch nicht alle in Kombination.

„Bislang galt die Annahme, dass DNA zwar vielversprechend für die langfristige Datenspeicherung sei, es jedoch schwierig oder gar unmöglich wäre, eine DNA-basierte Technologie zu entwickeln, die den vollständigen Funktionsumfang herkömmlicher elektronischer Systeme abbildet (...) und all dies auf programmierbare und wiederholbare Weise,“ kommentiert Albert Keung, ein außerordentlicher Professor für Chemie- und Biomolekulartechnik sowie Goodnight Distinguished Scholar an der NC State University. Diese Hürde ist jetzt überwunden worden.

Fazit

Flüssige DNA-Computer und Speicher nähern sich der Marktreife. DNA-Moleküle können nicht nur als Träger genetischer Informationen dienen, sondern zugleich Leitungen bilden, Steuerungsbefehle übertragen und ähnlich wie Elektronen Signale innerhalb von Schaltungen eines biologischen Computers übertragen.

Mit DNA als Speichermedium und Rechenengine werden die Grenzen der Computertechnologie neu gezogen. Eine volumetrische Dichte, die konventionellen Flash-Speicher um den Faktor 1000 übertrifft, und ein um den Faktor 100 Millionen(!) geringerer Energieverbrauch im Vergleich zu herkömmlichen Technologien positioniert DNA-Speicher als eine ernstzunehmende Technologie, die hoffentlich keine größeren Probleme schafft, als sie löst. Das werden wir sehen.

Dieser Artikel erschien zunächst auf unserem Schwesterportal Elektronikpraxis. (mbf)

* Anna Kobylinska und Filipe Pereia Martins arbeiten für McKinley Denali, Inc., USA.

(ID:50404246)