Professor: Lige nu er bånd-storage den mest langtidsholdbare teknologi

Illustration: kubais/Bigstock
Diske, der crasher, og højt strømforbrug er storage-teknologiens akilleshæl. En ny generation af NV RAM er den enhjørning, som kan gøre eksplosionen i datamængder til at betale.

De eksisterende storage-teknologier er både for dyre og for dårlige til effektivt at kunne håndtere eksploderende stigende mængder af data, som vi gerne vil gemme for eftertiden.

Brian Vinter er professor ved Niels Bohr Institutet. Illustration: Privatfoto

Det mener professor Brian Vinter fra Niels Bohr Institutet ved København Universitet, hvor han er ansvarlig for sine kollegers adgang til store mængder af forskningsdata.

De nuværende storage-teknologier for meget store datasamlinger er næsten udelukkende bygget på roterende diske med højt strømforbrug og høj fejlrate, som især på længere sigt gør det til en dyr fornøjelse at gemme store datamængder.

»Stort set alt indenfor high volume storage er lige nu baseret på roterende harddiske. Det slår igennem på elregningen, plus at vedligeholdelsen kræver mange mandetimer. Alt i alt bliver det dyrt,« siger Brian Vinter.

Han er samtidig skeptisk overfor udsigten til, at Solid State-diske (SSD) for alvor vil kunne løse storage-udfordringerne.

»Der er nok ikke tvivl om, at SSD er stærkt på vej til at kunne matche de snurrende diske, både når det gælder kvalitet og pris. SSD har yderligere den fordel, at de er bedre til at håndtere data, der ikke er lagret sekventielt. Og når de går i stykker, sker det på en 'pænere' måde end de roterende fætre,« siger Brian Vinter.

»Men SSD-teknologien løser ikke strømproblemet, og det er det afgørende, når man som jeg vil gemme sine data på en tidshorisont, der hedder 10-20-30 år.«

Her og nu har Brian Vinter derfor større fidus til den klassiske lagring via bånd-storage.

»Tape-storage er allerede meget konkurrencedygtig. Priserne er cirka det samme som på harddiske, og så er de hurtigere. Men den helt store fordel er, at de ikke bruger strøm, når båndspolen bare står på hylden. Og i de næste generation af tape-løsninger forventes levetiden at stige med en faktor ti til op omkring 30 år,« siger han.

I horisonten lurer en helt fjerde mulighed – NV RAM. Trods problemer med at få teknologien til at fungere i storskala forventer Brian Vinter, at NV RAM er et realistisk bud på en permanent og billig storage-teknologi.

»Det er enhjørningen, som vi alle sammen venter på. Det bliver billigt. Det bliver hurtigt, og det bruger ingen strøm,« slutter han.

Brian Vinter er professor ved Niels Bohr Institutet. Ved Version2s konference Datacenter 2018 den 2. – 3. maj 2018 fortæller han om de økonomiske og teknologiske dilemmaer, som opstår, når man skal designe langtidsholdbare storage-løsninger.

Tips og korrekturforslag til denne historie sendes til tip@version2.dk
Følg forløbet
Kommentarer (16)
sortSortér kommentarer
  • Ældste først
  • Nyeste først
  • Bedste først
Morten Andersen

Jeg kan heller ikke finde hoved og hale i argumenterne.

Jeg er dog enig med ham mht. SSD - her er det rigtigt at levetiden af data formentlig er relativt kort uden strøm, og det bliver værre og værre efterhånden som tæthederne stiger.
Problemerne begyndte især at vise sig ved TLC SSD'er. De fleste SSD-diske i dag genskriver data i baggrunden når de er tændt. Industriststandarden, JEDEC-specifikationerne, kræver faktisk kun 1 års unpowered "data retention" for consumer SSD drev (ved 30 grader) og kun 3 måneder for enterprise (grunden til der her kræves lavere er at det tillader andre trade-offs i.f.t. hastighed og antal skrivninger, som i enterprise-scenarier er mere relevante end retention tiden, idet diskene typisk er tændt hele tiden. I praksis har SSD'erne nok noget længere retention tid, svarende til garantiperioden, men mange SSD-fejl antages at skyldes retention-problemer, som medfører tab af firmware og/eller vigtige tabeller.

Men jeg forstår ikke han i samme moment nævner harddiske (i hvert fald når man ikke også nævner bånd). Alm. harddiske har selvfølgelig også en grænse for retention (som for alle fysiske medier) men den er noget højere, og det samme fysiske fænomen gør sig gældende for bånd.

Jeg forstår heller ikke han siger bånd er hurtigere end diske?

I det hele taget deler artiklen ikke op i "online" og "offline" lagring, som jo er helt centralt når man skal sammenligne. Bånd kan som bekendt ikke bruges til random-reads - kun bruges til data der sjældent bruges og helst i store sammenhængende portioner/batches. Derfor bruges det i praksis mest til backup. Tilgengæld er de billigere end harddiske (artiklen skriver dyrere?) og måske også mere pålidelige ved passiv lagring.

Jeg forstår heller ikke han fremhæver NV RAM (går ud fra han tænker på teknologier som Optane, Memristors, FeRAM etc.) - det er nok noget af det dyreste overhovedet (udover DRAM), så hvis prisen er en bekymring tror jeg ikke det er der man skal sætte sit håb. Fordelen ved NV RAM er at det er non-volatile, "næsten" (med meget varierende værdier af "næsten") ligeså hurtigt som DRAM, og kan understøtte mange skrivninger (typisk et par størrelsesordener flere end flash), og er betydeligt billigere end DRAM (som er det dyreste - næstefter selvfølgelig SRAM som bruges til caches osv!). Men det er stadig markant dyrere end flash, som i sig selv er markant dyrere end både harddiske og bånd, og det vil det formentlig blive ved med at være i al overskuelig fremtid. Det ses ikke som et alternativ til harddiske/bånd pga. pris, men et muligt alternativ til DRAM pga. en hastighed der er i nærheden samt non-volatilitet.

Så alt i alt synes jeg det er en lidt rodet artikel - der bør opdeles i forskellige formål for storage (online/offline) og de trade-offs der er mellem de forskellige storage typer.

Poul-Henning Kamp Blogger

Roterende diske og SSD bruger da heller ikke strøm når de står på hylden :-)

Det afhænger af hvor længe du skal have dem liggende på hylden.

Både moderne diske og flash-chips bruger så få atomer på hver bit, at kvantefysiske og termodynamiske processer over tid gør at data udviskes.

Bånd lider sådan set af samme problem, men her har man forlængst indbygget automatisk "refresh" i båndrobotterne.

Ole Kaas

Bånd kan som bekendt ikke bruges til random-reads - kun bruges til data der sjældent bruges og helst i store sammenhængende portioner/batches.

Der findes faktisk båndstationer der tilbyder random seek. Latency er naturligvis relativt høj. De fleste båndstationer til almindelig backup tilbyder dog kun sekventiel seek hvor båndet skal spoles igennem forfra for at søge efter en fil. Når man har set hvor hurtig en båndrobot arbejder, kan man godt have den mistænkt for at kunne finde en fil hurtigere end på en harddisk der skal koldstartes.

Lars Andersen

Praktisk erfaring viser at de kan holde enddog meget længe. Op mod 10 år i stabil temperatur.

Men opbevaring af hdd/ssd er udenfor spec af producenter, og dem der er i markedet for denne slags storage er ikke så meget for eksperimenter.

Henrik Eriksen

Det hed sig i gamle dage, at man skulle spole sine videofilm igennem en gang om året for at forhindre at båndene skulle klistre sammen. Og det var analoge data, hvor lidt flimmer ikke gjorde at filmen ikke kunne ses.
Hvis det er digitale sager, så skal der vel ikke ødelægges mange bit for båndet er værdiløst?
Og 30 års opbevaring af et bånd?
Har båndteknologien pludselig gennemgået en eller anden utrolig udvikling som jeg ikke har hørt om?

Klaus Birkelund Abildgaard Jensen

Der findes faktisk båndstationer der tilbyder random seek. Latency er naturligvis relativt høj.

Jeg er ikke helt sikker på hvad du mener med "random seek". Bånd er og bliver et sekventielt medie. Men det er korrekt at båndstationer tillader "spacing", altså spole imellem individuelle file marks.

De fleste båndstationer til almindelig backup tilbyder dog kun sekventiel seek hvor båndet skal spoles igennem forfra for at søge efter en fil.

Hvorvidt båndet skal søges igennem for at finde en fil afhænger af formatet. Man kan eksempelvis benytte Linear Tape File System (LTFS), som opretholder et indeks på båndet. Således kan en fils position lokaliseres ved blot at mounte båndet i en båndstation og læse indekset som typisk befinder sig i starten af båndet. Bemærk dog at et moderne bånd af for eksempel LTO typen kræver i omegnen af 100 sekunder for at spole fra BOT til EOT.

Og 30 års opbevaring af et bånd?
Har båndteknologien pludselig gennemgået en eller anden utrolig udvikling som jeg ikke har hørt om?

Ja, LTO, som sidder på 93% af markedet, er designet til 15-30 års opbevaring.

Baldur Norddahl

Når man har set hvor hurtig en båndrobot arbejder,

Forestil dig så en båndrobot med 3½" harddiske istedet for båndkassetter...

Surt at det projekt blev kvalt i vuggen...

Hvad mener du med det? Hvis det tager 100 sekunder at spole, så bliver du pænt hurtigt udkonkurreret af en harddiskrobot, der arbejder med lidt lavere accelerationer.

Spørgsmålet er om bånd stadig er lovlige med de nye datadirektiver? Hvordan vil du slette persondata fra dine 15 år gamle bånd?

Baldur Norddahl

Den slags har vi udstyr til og vi har haft det i årtier.

Underforstået at du skal kunne slette det kun for dem der beder om det eller ikke længere er kunde i butikken.

Hele konceptet med at tage backup af rup og stub for at gemme båndene i 30 år er udfordret. Det må man simpelthen ikke.

Næsten alle backup strategier handler om at gemme data i generationer. Ingen tager med at det kan blive nødvendigt at slette data fra samtlige generationer. Det er designet til at det kan man ikke for blandt andet at beskytte imod ondsindede handlinger, hvor data slettes.

Kjeld Flarup Christensen

Næsten alle backup strategier handler om at gemme data i generationer.


Ashay har et indbygget rentention system i konfigurationen, så gamle versioner automatisk slettes.

Jeg tror at vi skal skelne mellem backup og arkivering.

Hele konceptet med at tage backup af rup og stub for at gemme båndene i 30 år er udfordret. Det må man simpelthen ikke.


Man skal nok have tilladelse af datatilsynet.
Men jeg kunne nok nævne en række offentlige registre (Ud over PET's), hvor der er en juridisk og historisk interesse i at gemme data for tid og evighed. F.eks. Folkeregistret.

Mikkel Bundgaard

Problemet er ikke slette båndet eller harddisken, problemet er at slette udvalgt data som typisk er gemt i en database på backup bånd.

Men GDPR kræver ikke at virksomheden sletter sine backups, blot fordi en kunde ønsker at blive slettet(så vidt jeg ved).

Log ind eller Opret konto for at kommentere