SSD'ernes holdbarhed falder: Drev fejler efter få måneder

Forbrugerne kræver større kapacitet for færre penge på SSD, og det giver problemer for professionelle brugere, der har brug for længere levetid.

FRANKFURT: De nyeste SSD-drev kommer til at dø hurtigere end deres forgængere. Den usædvanlige udvikling skyldes måden flash-hukommelse fungerer på, og det tvinger leverandørerne til at tænke i alternative måder at forlænge levetiden på.

»Det er forbrugermarkedet, der driver produktionen af flash-hukommelse. Producenterne sælger størstedelen til tablets og bærbare pc'er, og presset på prisen og højere datatæthed giver problemer,« siger marketingchef Adrian Proctor fra hukommelsesproducenten Viking Technology.

Forbrugerprodukterne stiller ikke samme krav til levetiden, som virksomheder stiller til deres storagesystemer, og derfor bliver det meste flash-hukommelse i dag produceret med stadig lavere forventet levetid. Det sker som følge af, at kredsløbene gøres mindre for at få mere kapacitet på mindre plads.

Hvor flash-hukommelse af NAND MLC-typen, der primært bruges i pc'er, tidligere kunne holde til 10.000 overskrivninger, så er de nyeste udgaver nu nede på kun at kunne holde til 3.000. Det giver problemer, når den samme teknologi bruges i storageløsninger i datacenteret.

»Vi har set kunder, hvor drevene er slidt op efter ni måneder,« siger Adrian Proctor.

En tommelfingerregel for storageansvarlige har tidligere lydt, at man helst skulle købe et storagesystem, der kunne holde til 10 fulde overskrivninger hver dag i fem år.

»Det er meget få, der kommer op på det, men almindelig MLC-hukommelse vil i så fald kun holde i 20 dage,« siger salgsdirektør Kim Gardner fra STEC, som producerer SSD-storage.

Læs også: Dyr SSD kan give servere i sneglefart

MLC er den type flash-hukommelse, hvor hver celle kan være i fire tilstande i stedet for blot to i den mere robuste SLC-udgave af flash-hukommelse.

Fordi en enkelt celle i SLC blot skal kunne være i to tilstande, så er der mere frirum til at bære over med det slid, der uundgåeligt sker på NAND flash-hukommelse. SLC bliver dog produceret i mindre mængder og kan heller ikke rumme lige så mange data på den samme plads som MLC. Derfor er flere storageproducenter begyndt at bruge MLC.

De fleste professionelle SSD-drev baseret på MLC bruger den såkaldte 'enterprise MLC' eller eMLC, som dog er fremstillet på samme måde som den billigere MLC-hukommelse. Der er blot tale om, at eMLC er bygget op af de bedste chips, som normalt skæres ud fra midten af de wafere, som chippene fremstilles på.

»En SSD fremstillet af MLC til forbrugermarkedet kan måske holde til 20 terabyte i sin levetid. En tilsvarende SSD med eMLC kan holde til 500 terabyte i sin levetid,« siger Kim Gardner.

Producenterne forsøger også at forlænge levetiden ved at udnytte drevene smartere, og det er som regel på det punkt, at de enkelte producenter forsøger at skille sig ud.

Det kan eksempelvis være ved at sprede overskrivningerne ud på en måde, så man ikke slider meget på bestemte områder af chippen, eller det kan være ved at bruge en lavere spænding til at skrive på jomfruelige områder og så øge den i takt med, at områderne bliver slidt.

Sådanne teknologier kan forlænge en SSD's levetid op til 40.000 overskrivninger, som er tættere på de op til 100.000 overskrivninger, som er muligt med SLC-typen af flash-hukommelse.

En anden udbredt strategi er at bruge flere chips, end man opgiver som samlet kapacitet. På den måde kan drevet begynde at tage ubrugte celler i brug på de ekstra chips i takt med, at cellerne slides op, uden drevet mister kapacitet.

Køber man et SSD-array enten med ren flash eller en blanding af SSD og harddiske, så vil leverandørerne også typisk anbefale en større kapacitet af SSD, end man ville med harddiske, for at have en overkapacitet at give af til at fordele slitagen.

Der er også flash-producenter, som sætter en kunstig hastighedsbegrænsning for drevene. Tanken er, at hvis drevet maksimalt kan levere et lavere antal IOPS, så vil der gå længere tid, før det bliver slidt op.

Som kunde er det derfor vigtigt dels at være opmærksom på de tekniske begrænsninger ved flash, men også at vide, hvordan man kommer til at bruge lagermedierne, før man investerer i SSD.

»Er SSD for eksempel gode til en applikation, hvor der bliver skrevet mange data? Bestemt Nej, men flash er rigtig godt til at blive læst. Der er leverandører, som vil forsøge at friste dig, men så viser det sig, at drevene står af efter et halvt år. Hvis din workload er 10 procents skrivninger, så er levetiden for SSD nede på få måneder,« siger Adrian Proctor.

Version2's rejse- og opholdsudgifter i forbindelse med dækningen af Powering the Cloud: SNW Europe 2012 er betalt af arrangøren Angel Business Communications.

Kommentarer (34)

Casper Bang

...at man i større grad, proaktivt kan overvåge sundhedstilstanden. En SSD dør ikke på samme non-deterministiske og pludselige måde som en mekanisk disk.

Som NAND chips bliver mindre, får de sværere og sværere ved at holde spændingen, og vi er nu på vej under de 20nm. Så spørgsmålet er om vi ikke kommer til at se MLC/SLC/TLC hybrider, hvor algoritmerne holder øje med om en blok er "hot" og derfor kan flytte fra MLC til SLC - en form for persistent cache, lidt ligesom arbejdshukommelse også benytter L1 og L2 cache.

Ove Andersen

For min skyld er det sådan set helt okay der er stor differentiering i kvaliteten af SSD diske, hvis bare det var muligt for kunden at gennemskue hvad der er hat og briller.

Det lyder desværre bare til, at det ikke er muligt for slut-kunden at gennemskue hvad en SSD disk egentligt kan holde til, og det hele bliver skjult bag røg og spejle.

Casper Bang

For min skyld er det sådan set helt okay der er stor differentiering i kvaliteten af SSD diske, hvis bare det var muligt for kunden at gennemskue hvad der er hat og briller.


Men hvordan skulle det kunne lade sig gøre? Det er jo lidt samme problematik som at sammenligne hvilken bil er "bedst", det kan man kun med meget tekniske kontekstuelle briller på.

Med SSD gælder, som med så meget andet, at man som udgangspunkt får hvad man betaler for. Vil man gå med livrem og seler, køber man dét med et godt ry, med lang garantiperiode, sikrer at der er support værktøj og sørger for bevidst at undervurdere levetiden.

I consumer SSD (MLC) kontekst, betyder det at man nok bør vælge Intel eller Samsung frem for OCZ og Transcend - også selv om sidstnævnte scorer lidt højere i performance.

Thomas Rasmussen

Uhmm... det ved jeg nu ikke.. jeg har mistet et par SSD'er i min arbejdsmaskine og den ene gang der frøs maskinen fuldstændig, efter en reboot kunne disk-værktøjer kun se at disken var 8.7 MB istedet for de 250GB som den normalt var... jeg havde ikke fået forvarsler eller lign... men granted at jeg ikke kørte overvågningsværktøjer på disken (consumer disk i en bærbar).

Baldur Norddahl

Den her artikel føles som en gang salgsgas der skal overbevise os om at det er pengene værd at købe enterprise-udstyr.

Det er det måske også. Men som oftest er det ikke. Hvad skal man med tommelfingerregler, hvor forfatteren indrømmer at de færreste er så hårde ved deres diske?

Har alle glemt hvad RAID står for? Redundant Array of INEXPENSIVE Disks.

Sandhedden er at du kan spare en stor del af IT-budgettet hvis du nøjes med at købe enterprise der hvor du har konstateret ved erfaring at de billige ikke dur.

Maciej Szeliga

Har alle glemt hvad RAID står for? Redundant Array of INEXPENSIVE Disks

Dengang jeg startede med RAID stod det for Redundant Array of Independent Disks...
Independent dvs. at diskene ikke sidder på samme motor.

Thue Kristensen

Uhmm... det ved jeg nu ikke.. jeg har mistet et par SSD'er i min arbejdsmaskine og den ene gang der frøs maskinen fuldstændig, efter en reboot kunne disk-værktøjer kun se at disken var 8.7 MB istedet for de 250GB som den normalt var... jeg havde ikke fået forvarsler eller lign...

Det lyder mere som en firmware-fejl end som en nedslidt disk. Jeg har indtryk af at der har været mange ikke helt gennemtestede firmwares på markedet.

I teorien er det kun flash-writes som kan fejle. Og hvis en RAM-cache til flash-write fejler, så markerer man bare cellen dårlig, og skriver indholdet til en reservecelle i stedet. Bare ved at overvåge antallet af reserveceller (plus et estimat for nedslidthed på de resterende celler) bør man altid have en god ide om hvor meget liv drevet har tilbage.

Thomas Rasmussen

Det lyder mere som en firmware-fejl end som en nedslidt disk. Jeg har indtryk af at der har været mange ikke helt gennemtestede firmwares på markedet.

Ja det er da meget muligt at det "kun" er firmwaren der er død, men det er jo ikke ligesom om at man bare lige lodder en ny firmware i disken og så har man adgang til sine data... set fra mig som bruger så er det uinteressant hvad det er som er fejlet i en disk, hvis ikke jeg kan få mine data ud, så er disken død... om det så er en dårlig lodning, firmware fejl, memory fejl eller lign, det er mindre vigtigt... jeg sidder med problemet at jeg skal have restoret data...

At jeg så mistede 3 diske indenfor kort tid, det gør bare hele oplevelsen meget ringere... den nuværende disk har heldigvis kørt stabilt de sidste 6-8 måneder... (7-9-13) :-)

Jesper Lund

Ja det er da meget muligt at det "kun" er firmwaren der er død, men det er jo ikke ligesom om at man bare lige lodder en ny firmware i disken og så har man adgang til sine data...

Firmware bugs plager desværre SSD markedet. Det bedste man kan gøre er nok at købe næst-nyeste generation, i stedet for den seneste, ud fra en betragtning om at det er et mere modent produkt og at eventuelle alvorlige firmware fejl er fundet. Selv om der lige er kommet en Samsung 840, kan man stadig overveje og vælge Samsung 830.

Lidt ligesom at man ikke installerer en ny Windows version før SP1 er kommet, eller en Ubuntu LTS før første point release (som 12.04.1). De andre må lege forsøgskaniner :-)

Måske skal man også gå uden om Sandforce controllere hvis risikoen for firmware fejl skal minimeres. Ud fra hvad der skrives i blogs og forum indlæg ser Sandforce controllere ud til at give flere problemer. Måske...

Martin Rasmussen

En tommelfingerregel for storageansvarlige har tidligere lydt, at man helst skulle købe et storagesystem, der kunne holde til 10 fulde overskrivninger hver dag i fem år.

»Det er meget få, der kommer op på det, men almindelig MLC-hukommelse vil i så fald kun holde i 20 dage,« siger salgsdirektør Kim Gardner fra STEC, som producerer SSD-storage.

Har i en reference til den udtalelse?
Det lyder da lidt som om han taler enten af uvidenhed, eller bevist med usandheder i hans udtalelser.
Når jeg hører sætningen 'storageansvarlige har tidligere lydt, at man helst skulle købe et storagesystem', så tænker jeg firma baserede løsninger, ikke private.
Da, som han selv bør vide, har firmaer har en del anderledes lagringsbehov og krav til disse en private.
Når dette tages i mende, så bør han vel også vide at deres ssd valg er en del anderledes, feks. intels 710, eller den nyere s3700'er ( http://www.anandtech.com/show/6432/the-intel-ssd-dc-s3700-intels-3rd-gen... ).
Disse ssd'er er klart bedre rustet mod det brugsmønster som han advarer om at de ikke kan klare - og næsten helt ironisk så nævner overstående link at de præcist kan klare præcist det som han mener et lagringssystem skal kunne - 10 daglige fulde skrivninger, i 5år.

Så... Hvad er det helt principielt han vil med sin udtalelse?
Eller prøver han bare at gøre et opråb til firmaer om at de ikke skal købe "alm. forbruger ssd'er"?

Baldur Norddahl

Så... Hvad er det helt principielt han vil med sin udtalelse?
Eller prøver han bare at gøre et opråb til firmaer om at de ikke skal købe "alm. forbruger ssd'er"?

Han er marketingchef for Viking Technology. Hvad mon de laver? Rigtigt gættet, de laver dyre SSD løsninger.

Det er hans job at lave opråb om at firmaer ikke skal bruge billig hardware. Firmaer skal i stedet købe hans produkter. Hans produkter er i prisklassen "du skal spørge efter et tilbud".

Sune Marcher

En SSD dør ikke på samme non-deterministiske og pludselige måde som en mekanisk disk.

Det er desværre ikke min (og andres) erfaring. En studiekammerat og jeg har begge oplevet af vores Vertex2 SSDer stod af efter få måneder (hvilket var firmware bug), og min Intel X25-E (SLC enterprise) stod pludseligt af uden advarsel efter nogle års (mild) brug.

Du har ganske ret i at hukommelsescellerne burde fejle gracefully, men det kan man bare ikke bruge til ret meget når drevene FUBARer af andre grunde, uden nogen som helst advarsel. Med et mekanisk drev er der i det mindste ofte nogle faresignaler før det går helt galt.

Afholder det mig fra at bruge SSD i min workstation? Og at have kritisk data på den? Nej, det er hastigheden for god til. Men jeg ville ikke gøre det uden kontinuerlig backup.

Thomas Rasmussen

Sjovt at det lige er vertex2 diske du har haft problemer med... det var nemlig også sådan nogle jeg mistede... efter et par forsøg så lykkedes det at overbevise leverandøren om at jeg skulle have et andet mærke, det endte derfor med en Kingston som nu har kørt fint (ok, jeg har så også mistet en kingston efterfølgende). Vi har i firmaet SSD'er i vores arbejdsbærbare og indtil videre har vi haft problemer med en 3-4 vertex2'er, 1 eller 2 Kingston og e eller 2 Intel. Det er bare ikke særlig imponerende når vi så samtidig kun har 16 bærbare i firmaet... så er det en meget stor fejlrate :-(

Men jeg vil heller ikke skifte tilbage til roterende disk, hastigheden i det daglige er simpelthen for god, men ugentlig fullbackup som kan restores direkte på en ny disk kombineret med incremental (løbende hvert kvarter) af Homedir, så tør jeg godt. :-)

Jan Mortensen

Har en del SSD'er i brug både privat og på arbejde; Kingston, Intel, OSZ, Samsung. I det sidste års tid er der kun købt Samsung 830.
Jeg har endnu ikke haft en SSD der har fejlet. Min første (Kingston 60 GB 2009) kører stadigt og det samme gør min Vertex2 120 GB.

Men jeg har er også over dem mht firmware og optimering i forhold til slitage.
Men et er slitage, noget andet alt det bøvl der har været med firmware fejl på de nyere Sandforce chipset. Det er døden for almindelige brugere/private. Har en kollega som fik en ny Kingston (Sandforce) i sin Workstation; desværre kom den med firmware fra sidste efterår => daglige BSOD

Nogle entusiaster med for meget fritid
http://www.xtremesystems.org/forums/showthread.php?271063-SSD-Write-Endu...

Poul-Henning Kamp

Den helt altafgørende faktor for SSDs levetid er om operativsystemet og filsystemerne har "TRIM" support eller ej.

Uden TRIM bliver enhver FLASH-disk slidt på ingen tid, fordi den konstant skal relokere sin free-pool.

Med TRIM er alt det ubrugte plads i et filsystem en del af free-pool og med mindre filsystemet er 100% fyldt reducerer det antallet af erase-cycles med en meget, MEGET, stor faktor.

Casper Bang

Den helt altafgørende faktor for SSDs levetid er om operativsystemet og filsystemerne har "TRIM" support eller ej.

Uden TRIM bliver enhver FLASH-disk slidt på ingen tid, fordi den konstant skal relokere sin free-pool.

Med TRIM er alt det ubrugte plads i et filsystem en del af free-pool og med mindre filsystemet er 100% fyldt reducerer det antallet af erase-cycles med en meget, MEGET, stor faktor.


Det er bare ikke altid man kan holde write-amplification i skak på denne måde, det gælder f.eks. i RAID's og diverse fancy enterprise controllere (HP jeg kigger på dig). Her må man istedet manuelt køre diverse wiper/hdparm kommandoer med jævne mellemrum. Der er også controllere der istedet for SATA TRIM hints benytter sig af garbage-collection når drevet er idle.

Casper Bang

Det er sådan set ligegyldigt om det er RAID eller et filsystem: Uden TRIM holder din flash ikke i længden, punktum.


TRIM er godt, men det afh. jo ret så meget af brugsmønsret. Vi har jo sådan set kørt med SSD'er i en del år, uden at have TRIM tilgængelig. Du har selv skrevet at det tog dig 2 år at torturere en X25M G1 til døde. Hvis dit ekstreme wear svarer til en faktor x10 over gennemsnittet, vil den holde i 20 år i typisk brug. Skal vi blive enige om, at få mennesker har samme computer/drev i så lang tid?

Casper Bang

Hvis du laver mange skrivninger men har TRIM support, lever din flash længere.


Ah ja se, det var jo en noget mere moderat udtalelse end din tidligere:

Uden TRIM bliver enhver FLASH-disk slidt på ingen tid, fordi den konstant skal relokere sin free-pool.

(SansForce's DuraWrite teknologi)[http://thessdreview.com/daily-news/latest-buzz/garbage-collection-and-tr...] sammen med over-provisioning (20% spare istedet for 7%) benytter sig ikke af trim og har derfor den fordel, at de fungerer i RAID scenarier. Det er tys-tys hvad de gør, men formeentlig noget block-level de-duplication/komprimering med dét resultat at der skrives mindre og write-amplification derved holdes nede. Det fungerer formodentlig bedst når entropien af data ikke er for høj, dvs godt til OS/programmer men mindre godt til ZIP/JPG/MP4 mv.

Casper Bang

Intel's nye prosumer S3700 serie disk benytter 25nm HET-MLC og er med sine 29% spare ret ligeglad med TRIM. Den synes derfor at være tiltænkt scenarier hvor TRIM ikke er en mulighed (f.eks. i RAID eller bag enterprise controllere).

Diskene er ratet til 1.825 PB skriving pr. 100GB. Det svarer til 10 gange overskrivninger dagligt i 5 år, og leverer konsistent skrivning af 140MB/s @ 4K random (35K IOPS).

Intel har tilsyneladende været 5 år undervejs med deres nye controller, og Anand mener det sætter standarden for alle deres controllere fremover. Det betyder at TRIM forbliver en fordel i forhold til GC, men absolut ingen nødvendighed for hverken performance eller endurance.

Casper Bang

Ja, så har vi to personer som har læst samme artikel, og sørme også linket til den 2 gange, med stort set samme kommentare.


Jeg havde ikke set (eller glemt) din kommentar. Jeg faldt over artiklen, fordi Anand gør klar til at interviewe Intel omkring emnet i morgen:
http://www.anandtech.com/show/6439/anandtech-webcast-live-from-sc12-ask-...

Kunne være man skulle indsende et spg. omrking TRIM.

Casper Bang

Kunne være man skulle indsende et spg. omrking TRIM.

Anand tog mit spørgsmål med og spurgte Intel om emnet, se evt. videoen her:
http://intelstudios.edgesuite.net/121113_sc12/archive/archive.htm

For at opsummere hvad der bliver sagt:
- En SSD er mere end blot sin NAND tecknologi (controller).
- Kun meget få har brug for udholdetheden af SLC NAND.
- Intel laver ikke længere SSD'er med SLC til SATA.
- Anandtech benytter sig KUN af SSD, pga. predictable failture (SMART).
- Anandtech har brugt Intel 320 MLC SSD'er i kalkulerede scenarier.
- Vi kommer ikke til at se enterprise/RAID controllere understøtte TRIM foreløbigt.
- TRIM er primært til consumer drev.
- TRIM har ingen praktiske fordele for Intel's nye drev.
- TRIM er sammenlignligt med et plaster.

Martin Rasmussen

Læs nu hvad Casper Bang skriver.
Lad mig quote:

For at opsummere hvad der bliver sagt:
- En SSD er mere end blot sin NAND tecknologi (controller).

Er det så ikke ret ... ligegyldigt kun at fokusere på en paramter hvor de "gå ned på", når der netop findes utallige?

Jeg vil tillade mig at quote mig selv, fra http://www.version2.dk/artikel/halvdelen-af-nordiske-it-chefer-har-ingen...;

Three different nodes experienced disk failures at once. We shipped off the Kingston E100 400GB drives to DriveSavers but the results were not good

Så ja, Casper Bang har ret, ssd' fejler også af andre ting end bare "write endurance, end of lifetime".
Så længe vi har personer i IT branchen der blot tror de fejler af en grund, så længe står det slemt til!

Steen Poulsen

SSD bygger på Flash.
Flash kan : Skrives FÅ gange, læses MANGE gange, altså sammenlignet med roterende disk.

Flash laver "Hot Electron Injection" er en form for kemiske bindinger. Nedbrydelse og opbygning er fysisk begrænset. (Limitation is that flash memory has a finite number of program-erase cycles (typically written as P/E cycles))

Diske er magnetisk polarisering. Her er det hovederne som går i stykker, ikke materialet som magnetiske polarisering opbevares i.

Derfor - Er og bliver roterende diske bedre til jobbet, Da en roterende disk er "ligeglad" med om du læser eller skriver.

En SSD er KUN velegent til minimal skrivning, og gentagende læsning.

Så uanset hvad, så skal det planlægges meget hvad man bruger en SSD til.

Og min personlige mening - drop SSD hvor driftsikkerhed betyder noget.
SSD er fin til boot partition, og måske OS filer, men ikke Bruger data, og slet ikke tmp filer. (F.eks. Spotify er virkelig storslem for en SSD disk, database er sikkert også dårlig for en SSD - Med mindre at databasen kun udvider, og aldrig ændre indhold.)

Log ind eller opret en konto for at skrive kommentarer

JobfinderJob i it-branchen

TDC skifter koncernchef efter faldende mobilomsætning

Jesper Stein Sandal Mobil og tele 14. aug 2015

Nyeste job

KurserStyrk dine evner med et kursus

Reporting Services

Hvornår: Hvor: Østjylland Pris: kr. Efter aftale

Softwarearkitektur i praksis

Hvornår: 2016-04-07 Hvor: Østjylland Pris: kr. 18000.00

Netværksteknologi - det samlede kursusforløb

Hvornår: 2015-09-28 Hvor: Storkøbenhavn Pris: kr. 37260.00

Skriv så - den effektive vej til gode tekster

Hvornår: 2015-10-07 Hvor: Storkøbenhavn Pris: kr. 4990.00

SharePoint kursus 2013 grundlæggende

Hvornår: 2015-11-09 Hvor: Storkøbenhavn Pris: kr. 10200.00