Forskere gemmer Shakespeare og MP3-filer i dna-streng

Ved at overføre data til dna-strenge, kan forskere nu gemme 2,2 petabyte pr. gram sikkert i mange tusind år. Teknologien kan blive udbredt inden for ti år, lyder vurderingen.

Har du fundet en diskette med gamle kærestebreve på, men har ikke længere et diskettedrev? Eller er dine backup-dvd’er pludseligt ulæselige?

Det er ikke nemt at gemme data for eftertiden i et format, som er holdbart, har en høj datatæthed og som også kan læses om mange år, men nu har et hold af internationale forskere med held forsøgt sig med et lagermedie, der lever op til alle kravene: dna-strenge.

Dna er livets helt små byggesten, og ved at manipulere med dna-strengene kan de kodes om til at gemme store mængder binære data. I forsøget fik forskerne således gemt hvad der svarer til 2,2 petabyte data pr. gram dna-materiale. Det skriver Ars Technica, ud fra en artikel i det videnskabelige tidskrift Nature.

Fordelen ved dna-lagring er, at dataene vil være tilgængelige i tusindvis af år. Ved at indtørre materialet kunne forskerne sende det rundt til andre lande, og ved korrekt, kølig opbevaring holder det sig i god stand i 5.000 år, lyder vurderingen.

Hver lokation i en dna-streng kan have fire forskellige værdier: A, T, C eller G. Binære data har i sagens natur kun to værdier, 0 eller 1, så forskerne omregnede dataene til trinære værdier, altså 0, 1 og 2, som så kunne erstattes af A, T og C. Den sidste værdi, G, blev brugt til at undgå et problem, som opstår, når en dna-sekvens har en lang række enslydende værdier. I stedet for A, A, A, A, A kunne forskerne så bruge G som en ’ditto’-værdi. En G-værdi skal altså bare tolkes som en gentagelse af værdien før, men på den måde undgik man de problematiske strenge med samme værdi mange gange i træk.

Andre tricks til at sikre datakvaliteten var at lave kraftige overlap, så de fleste data fandtes fire forskellige steder.

I forsøget blev 154 værker af Shakespeare, en MP3-fil med Martin Luther Kings berømte ’I have a dream’-tale og et foto af forskernes laboratorium kodet ind i dna-strenge. Forskerne, der er baseret i Californien og i England, tørrede så dna-materialet og sendte det til Tyskland, hvor det blev afkodet uden problemer.

Der blev i forsøget brugt dna-materiale i en mængde, der gør det muligt at finde det frem igen mindst ti gange og udtage dna. Men i øjeblikket er det dog stadig en dyr måde at gemme data på. Først hvis kravet er, at data skal gemmes i mindst 500 år, vil dna-løsningen give økonomisk mening.

Med udviklingen i teknologien mener forskerne dog, at økonomien vil ændre sig så meget de næste ti år, at dna-lagring vil være den mest økonomiske løsning, også hvis kravet kun er 50 års lagring.

Tips og korrekturforslag til denne historie sendes til tip@version2.dk
Kommentarer (8)
sortSortér kommentarer
  • Ældste først
  • Nyeste først
  • Bedste først
#2 Daniel Noesgaard

Det skal tænkes som et holdbart alternativ til arkivering. Altså til data som ikke nødvendig er relevant nu, men som vi gerne vil kunne tilgå på tidspunkt i fremtiden. DNA sekventering (altså aflæsning af koden) er tidskrævende og dyr, men udviklingen går stærkt. Fokus er især på at gøre sekventering af hele humane genomer mere tilgængelig, og der er spillere på markedet som påstår at have udstyr, som kan gøre netop det i løbet af én dag for "kun" $1000.

PS. Der er vist ikke noget der hedder "trinær". Det hedder ternær.

  • 0
  • 0
#3 Nils Bøjden

" Først hvis kravet er, at data skal gemmes i mindst 500 år, vil DNA-løsningen give økonomisk mening."

Gad vide hvor mange af vores elektroniske medier vi er i stand til at fortolke om 500 år.

Men lige præcis DNA er måske en bedre ide, da der formodentlig er større sandsynlig for at vi er i stand til at afkode en DNA streng om 500 år, end vi er i stand til at læse indholdet af en 8" diskette.

  • 0
  • 0
#5 Folmer Fredslund

"we estimate current costs to be $12,400 MB−1 for information storage in DNA and $220 MB−1 for information decoding"

Det er nok indtil videre lidt for meget ;-)

(i artiklen har de kodet 739 kilobytes i DNA)

  • 0
  • 0
#8 Deleted User

Et problem er, at læsningen som udgangspunkt er destruktiv. Det vil sige, at man skal tage en fysisk kopi hver eneste gang man vil læse data. Det tager tid.

Et andet problem er at læsehastigheden skal måles i timer og kræver voldsomt dyrt udstyr, der fylder. Selve læsningen koster derimod ikke mere end 10-20 kr per 1 mio. basepar.

Det er heller ikke trivielt at gemme DNA i 5.000 år. Slet ikke hvis data er krypteret, da der så ikke skal ryge ret mange enkelte baser før det hele går i kludder.

Ideen er dog meget sjov i kategorien "fordi man kan".

  • 0
  • 0
Log ind eller Opret konto for at kommentere