Professor: Lige nu er bånd-storage den mest langtidsholdbare teknologi

5. april 2018 kl. 05:1116
Professor: Lige nu er bånd-storage den mest langtidsholdbare teknologi
Illustration: kubais/Bigstock.
Diske, der crasher, og højt strømforbrug er storage-teknologiens akilleshæl. En ny generation af NV RAM er den enhjørning, som kan gøre eksplosionen i datamængder til at betale.
Artiklen er ældre end 30 dage
Manglende links i teksten kan sandsynligvis findes i bunden af artiklen.

De eksisterende storage-teknologier er både for dyre og for dårlige til effektivt at kunne håndtere eksploderende stigende mængder af data, som vi gerne vil gemme for eftertiden.

Brian Vinter er professor ved Niels Bohr Institutet.

Det mener professor Brian Vinter fra Niels Bohr Institutet ved København Universitet, hvor han er ansvarlig for sine kollegers adgang til store mængder af forskningsdata.

De nuværende storage-teknologier for meget store datasamlinger er næsten udelukkende bygget på roterende diske med højt strømforbrug og høj fejlrate, som især på længere sigt gør det til en dyr fornøjelse at gemme store datamængder.

Artiklen fortsætter efter annoncen

Version2 Datacenter

Sammen med Infosecurity Denmark byder Version2 Datacenter 2018 på mere end 110 seminarer og cases, 25 keynotes og 80 udstillere. To dage med masser af faglig viden og netværk d. 2. og 3. maj i Øksnehallen i København.

Version2 Datacenter er på 6. år Danmarks største event inden for datacenter- og cloudløsninger. Og på blot fem år er der sket en kæmpe udvikling.

Mængden af cloudtjenester er mangedoblet og fremtiden tjenester skal leveres på ”cloud-lignende” vilkår, uanset om man har eget datacenter, cloud eller en hybrid.

Her kan du på to dages konference hente viden til strategier på området, og på messen kan du møde førende leverandører for en konkret snak om jeres muligheder.

Flere oplysninger
Vil du gå direkte til tilmelding, klik her.

Version2 Infosecurity

It-sikkerhedsmessen Infosecurity Denmark 2018 byder på mere end 110 seminarer og cases, 25 udvalgte keynotes og 80 udstillere. To dage med masser af faglig viden og netværk d. 2. og 3. maj i Øksnehallen i København.

Konferenceprogrammet dækker både compliance, cybercrime, IoT, nye teknologier som AI og blockchain samt cloud security og giver et unikt indblik i de nyeste it-sikkerhedsmæssige udfordringer på et højt fagligt niveau.

Du bliver opdateret om både de nyeste tekniske landvindinger fra spydspidsforskere og får indblik i aktuelle trusselsbilleder fra nogle af verdens bedste rådgivere.

Flere oplysninger

Vil du gå direkte til tilmelding, klik her.

»Stort set alt indenfor high volume storage er lige nu baseret på roterende harddiske. Det slår igennem på elregningen, plus at vedligeholdelsen kræver mange mandetimer. Alt i alt bliver det dyrt,« siger Brian Vinter.

Han er samtidig skeptisk overfor udsigten til, at Solid State-diske (SSD) for alvor vil kunne løse storage-udfordringerne.

»Der er nok ikke tvivl om, at SSD er stærkt på vej til at kunne matche de snurrende diske, både når det gælder kvalitet og pris. SSD har yderligere den fordel, at de er bedre til at håndtere data, der ikke er lagret sekventielt. Og når de går i stykker, sker det på en 'pænere' måde end de roterende fætre,« siger Brian Vinter.

»Men SSD-teknologien løser ikke strømproblemet, og det er det afgørende, når man som jeg vil gemme sine data på en tidshorisont, der hedder 10-20-30 år.«

Artiklen fortsætter efter annoncen

Her og nu har Brian Vinter derfor større fidus til den klassiske lagring via bånd-storage.

»Tape-storage er allerede meget konkurrencedygtig. Priserne er cirka det samme som på harddiske, og så er de hurtigere. Men den helt store fordel er, at de ikke bruger strøm, når båndspolen bare står på hylden. Og i de næste generation af tape-løsninger forventes levetiden at stige med en faktor ti til op omkring 30 år,« siger han.

I horisonten lurer en helt fjerde mulighed – NV RAM. Trods problemer med at få teknologien til at fungere i storskala forventer Brian Vinter, at NV RAM er et realistisk bud på en permanent og billig storage-teknologi.

»Det er enhjørningen, som vi alle sammen venter på. Det bliver billigt. Det bliver hurtigt, og det bruger ingen strøm,« slutter han.

Brian Vinter er professor ved Niels Bohr Institutet. Ved Version2s konference Datacenter 2018 den 2. – 3. maj 2018 fortæller han om de økonomiske og teknologiske dilemmaer, som opstår, når man skal designe langtidsholdbare storage-løsninger.

16 kommentarer.  Hop til debatten
Denne artikel er gratis...

...men det er dyrt at lave god journalistik. Derfor beder vi dig overveje at tegne abonnement på Version2.

Digitaliseringen buldrer derudaf, og it-folkene tegner fremtidens Danmark. Derfor er det vigtigere end nogensinde med et kvalificeret bud på, hvordan it bedst kan være med til at udvikle det danske samfund og erhvervsliv.

Og der har aldrig været mere akut brug for en kritisk vagthund, der råber op, når der tages forkerte it-beslutninger.

Den rolle har Version2 indtaget siden 2006 - og det bliver vi ved med.

Debatten
Log ind eller opret en bruger for at deltage i debatten.
settingsDebatindstillinger
16
8. april 2018 kl. 10:52

Problemet er ikke slette båndet eller harddisken, problemet er at slette udvalgt data som typisk er gemt i en database på backup bånd.

Men GDPR kræver ikke at virksomheden sletter sine backups, blot fordi en kunde ønsker at blive slettet(så vidt jeg ved).

15
8. april 2018 kl. 10:32

Næsten alle backup strategier handler om at gemme data i generationer.

Ashay har et indbygget rentention system i konfigurationen, så gamle versioner automatisk slettes.

Jeg tror at vi skal skelne mellem backup og arkivering.

Hele konceptet med at tage backup af rup og stub for at gemme båndene i 30 år er udfordret. Det må man simpelthen ikke.

Man skal nok have tilladelse af datatilsynet. Men jeg kunne nok nævne en række offentlige registre (Ud over PET's), hvor der er en juridisk og historisk interesse i at gemme data for tid og evighed. F.eks. Folkeregistret.

14
8. april 2018 kl. 09:49

Den slags har vi udstyr til og vi har haft det i årtier.

Underforstået at du skal kunne slette det kun for dem der beder om det eller ikke længere er kunde i butikken.

Hele konceptet med at tage backup af rup og stub for at gemme båndene i 30 år er udfordret. Det må man simpelthen ikke.

Næsten alle backup strategier handler om at gemme data i generationer. Ingen tager med at det kan blive nødvendigt at slette data fra samtlige generationer. Det er designet til at det kan man ikke for blandt andet at beskytte imod ondsindede handlinger, hvor data slettes.

11
5. april 2018 kl. 14:31

Når man har set hvor hurtig en båndrobot arbejder,</p>
<p>Forestil dig så en båndrobot med 3½" harddiske istedet for båndkassetter...</p>
<p>Surt at det projekt blev kvalt i vuggen...

Hvad mener du med det? Hvis det tager 100 sekunder at spole, så bliver du pænt hurtigt udkonkurreret af en harddiskrobot, der arbejder med lidt lavere accelerationer.

Spørgsmålet er om bånd stadig er lovlige med de nye datadirektiver? Hvordan vil du slette persondata fra dine 15 år gamle bånd?

9
5. april 2018 kl. 13:00

Og 30 års opbevaring af et bånd?
Har båndteknologien pludselig gennemgået en eller anden utrolig udvikling som jeg ikke har hørt om?

DLT bånd var udviklet med den tid som mål og de nåede faktisk at bevise det inden standarden blev overhalet af LTO.

7
5. april 2018 kl. 10:53

Der findes faktisk båndstationer der tilbyder random seek. Latency er naturligvis relativt høj.

Jeg er ikke helt sikker på hvad du mener med "random seek". Bånd er og bliver et sekventielt medie. Men det er korrekt at båndstationer tillader "spacing", altså spole imellem individuelle file marks.

De fleste båndstationer til almindelig backup tilbyder dog kun sekventiel seek hvor båndet skal spoles igennem forfra for at søge efter en fil.

Hvorvidt båndet skal søges igennem for at finde en fil afhænger af formatet. Man kan eksempelvis benytte Linear Tape File System (LTFS), som opretholder et indeks på båndet. Således kan en fils position lokaliseres ved blot at mounte båndet i en båndstation og læse indekset som typisk befinder sig i starten af båndet. Bemærk dog at et moderne bånd af for eksempel LTO typen kræver i omegnen af 100 sekunder for at spole fra BOT til EOT.

Og 30 års opbevaring af et bånd?
Har båndteknologien pludselig gennemgået en eller anden utrolig udvikling som jeg ikke har hørt om?

Ja, LTO, som sidder på 93% af markedet, er designet til 15-30 års opbevaring.

6
5. april 2018 kl. 10:36

Det hed sig i gamle dage, at man skulle spole sine videofilm igennem en gang om året for at forhindre at båndene skulle klistre sammen. Og det var analoge data, hvor lidt flimmer ikke gjorde at filmen ikke kunne ses. Hvis det er digitale sager, så skal der vel ikke ødelægges mange bit for båndet er værdiløst? Og 30 års opbevaring af et bånd? Har båndteknologien pludselig gennemgået en eller anden utrolig udvikling som jeg ikke har hørt om?

5
5. april 2018 kl. 10:25

Praktisk erfaring viser at de kan holde enddog meget længe. Op mod 10 år i stabil temperatur.

Men opbevaring af hdd/ssd er udenfor spec af producenter, og dem der er i markedet for denne slags storage er ikke så meget for eksperimenter.

4
5. april 2018 kl. 10:07

Bånd kan som bekendt ikke bruges til random-reads - kun bruges til data der sjældent bruges og helst i store sammenhængende portioner/batches.

Der findes faktisk båndstationer der tilbyder random seek. Latency er naturligvis relativt høj. De fleste båndstationer til almindelig backup tilbyder dog kun sekventiel seek hvor båndet skal spoles igennem forfra for at søge efter en fil. Når man har set hvor hurtig en båndrobot arbejder, kan man godt have den mistænkt for at kunne finde en fil hurtigere end på en harddisk der skal koldstartes.

2
5. april 2018 kl. 09:29

Jeg kan heller ikke finde hoved og hale i argumenterne.

Jeg er dog enig med ham mht. SSD - her er det rigtigt at levetiden af data formentlig er relativt kort uden strøm, og det bliver værre og værre efterhånden som tæthederne stiger. Problemerne begyndte især at vise sig ved TLC SSD'er. De fleste SSD-diske i dag genskriver data i baggrunden når de er tændt. Industriststandarden, JEDEC-specifikationerne, kræver faktisk kun 1 års unpowered "data retention" for consumer SSD drev (ved 30 grader) og kun 3 måneder for enterprise (grunden til der her kræves lavere er at det tillader andre trade-offs i.f.t. hastighed og antal skrivninger, som i enterprise-scenarier er mere relevante end retention tiden, idet diskene typisk er tændt hele tiden. I praksis har SSD'erne nok noget længere retention tid, svarende til garantiperioden, men mange SSD-fejl antages at skyldes retention-problemer, som medfører tab af firmware og/eller vigtige tabeller.

Men jeg forstår ikke han i samme moment nævner harddiske (i hvert fald når man ikke også nævner bånd). Alm. harddiske har selvfølgelig også en grænse for retention (som for alle fysiske medier) men den er noget højere, og det samme fysiske fænomen gør sig gældende for bånd.

Jeg forstår heller ikke han siger bånd er hurtigere end diske?

I det hele taget deler artiklen ikke op i "online" og "offline" lagring, som jo er helt centralt når man skal sammenligne. Bånd kan som bekendt ikke bruges til random-reads - kun bruges til data der sjældent bruges og helst i store sammenhængende portioner/batches. Derfor bruges det i praksis mest til backup. Tilgengæld er de billigere end harddiske (artiklen skriver dyrere?) og måske også mere pålidelige ved passiv lagring.

Jeg forstår heller ikke han fremhæver NV RAM (går ud fra han tænker på teknologier som Optane, Memristors, FeRAM etc.) - det er nok noget af det dyreste overhovedet (udover DRAM), så hvis prisen er en bekymring tror jeg ikke det er der man skal sætte sit håb. Fordelen ved NV RAM er at det er non-volatile, "næsten" (med meget varierende værdier af "næsten") ligeså hurtigt som DRAM, og kan understøtte mange skrivninger (typisk et par størrelsesordener flere end flash), og er betydeligt billigere end DRAM (som er det dyreste - næstefter selvfølgelig SRAM som bruges til caches osv!). Men det er stadig markant dyrere end flash, som i sig selv er markant dyrere end både harddiske og bånd, og det vil det formentlig blive ved med at være i al overskuelig fremtid. Det ses ikke som et alternativ til harddiske/bånd pga. pris, men et muligt alternativ til DRAM pga. en hastighed der er i nærheden samt non-volatilitet.

Så alt i alt synes jeg det er en lidt rodet artikel - der bør opdeles i forskellige formål for storage (online/offline) og de trade-offs der er mellem de forskellige storage typer.

1
5. april 2018 kl. 08:26

"Men den helt store fordel er, at de ikke bruger strøm, når båndspolen bare står på hylden." Roterende diske og SSD bruger da heller ikke strøm når de står på hylden :-)