Sådan skar Novozymes søgetiden fra 40 til 8 sekunder med 25 SSD-diske

Novozymes har opbygget et nyt system på tre terabyte forskningsdata baseret på SSD-diske, som ikke er i enterprise-klassen. Diskenes kortere levetid bliver nemlig ikke aktuel for Novozymes.

Uden at ændre en eneste kodelinje og med bare fem minutters planlagt nedetid har Novozymes fået skåret svartiden på de tungeste forespørgsler i et storagesystem ned til en femtedel.

En applikation til håndtering af proteinsekvenser i forskningen giver nu svar allerede efter 6-8 sekunder, hvor den tidligere kunne være op til 40 sekunder om et svar.

Det er sket takket være et nyt storagesystem baseret på SSD-diske, som understøtter en Linux- og Postgresql-baseret applikation, der er udviklet internt i R&D Data Management hos Novozymes.

»Før kørte applikationen på et setup med almindelige diske. Worst case for forespørgsler er bragt ned til 6-8 sekunder. Det havde været utroligt svært at opnå med traditionelle diske.« siger Jesper Krogh, Manager i Novozymes.

Storagesystemet består af en RAID-controller og 25 af Intels 160 gigabyte X25-M SSD-diske samlet i et HP StorageWorks D2700-kabinet. Opsætningen giver i alt en kapacitet på omkring tre terabyte, hvoraf databasen i øjeblikket bruger cirka 1,5 terabyte.

Dermed ligger systemet i det område, hvor det er uden for økonomisk rækkevidde at køre med en in-memory database lagret i RAM, men hvor det samtidig kan lade sig gøre at bruge SSD-diske i stedet for billigere konventionelle diske.

»Alternativet havde været at vente på, at in-memory nåede derop eller at omskrive applikationen. Så det her var en hurtig løsning, som mere end fordoblede ydelsen. Det er en internt udviklet applikation, og det ville have kostet mange udviklingstimer for at kunne opnå det samme. Og så var det ikke garanteret, at det kunne gøre en lige så stor forskel,« forklarer Jesper Krogh.

I praksis bliver systemet imidlertid anvendt af få samtidige brugere, så springet op til et RAM-caching-system havde formentligt også været rent overkill i forhold til, hvor svært det ville være at udnytte det fornuftigt.

**LÆS OGSÅ **SSD-diske vandt over RAM-klodser i danske biblioteksdatabaser

Ved at skifte det gamle diskbaserede storagesystem ud med et meget tilsvarende system, blot baseret på SSD-diske i stedet, var det også muligt at minimere nedetiden i forbindelse med skiftet. Selve systemet var blot nede i fem minutter, mens data blev kopieret.

»Uden ændringer i applikationen har vi leveret to til fire gange hurtigere ydelse. Det havde vi skullet kæmpe enormt for på konventionelle diske,« siger Jesper Krogh.

Ved denne forskningsapplikation var det forsvarligt at basere systemet på 160 gigabyte SSD-diske fra Intel som strengt taget ikke er beregnet til at blive anvendt i kritiske datasystemer. Men Intel ventes først til næste år at opgradere kapaciteten på dets SSD-diske i enterprise-klassen, X25-E. Forskellen mellem X25-E og X25-M er dog primært i holdbarhed, hvor chippene i X25-E er garanteret til at holde cirka 10 gange længere.

»Akilleshælen er 160 gigabyte diskene, som ikke er enterprise. Så vi må forvente en kortere levetid, men i praksis ser det ikke ud til at være noget problem,« siger Jesper Krogh.

**LÆS OGSÅ **Dansk filmselskab får filserver til lavpris med Opensolaris og SSD

Applikationen kan nemlig nå sin maksimale kapacitet i løbet af to år, og diskenes levetid burde derfor ikke nå at blive et problem. Flash-hukommelseskredse kan kun overskrives et vist antal gange, før de mister deres evne til at holde på data. Til gengæld er levetiden en velkendt størrelse, og diskene sørger selv for at sprede skrivningerne ud over forskellige kredsløb for at fordele sliddet.

Det nye SSD-baserede system betyder også, at it-folkene hos R&D Data Management i Novozymes nu får erfaring med implementering og drift af SSD udover de konventionelle diske, som ellers bliver brugt i de øvrige storagesystemer.

»Min mavefornemmelse er, at det næste diskarray vi køber til vores interne forskningssystemer,bliver det sidste med roterende diske. Priserne er lige nu 2-3 gange dyrere pr. terabyte, men den prisforskel vil blive mindre. Konventionelle diske yder ikke så godt for random tilgang til data, som er vigtigt for denne applikation.. Og så får man også de andre fordele, som at SSD er strømsvage og lydløse,« siger Jesper Krogh.

Tips og korrekturforslag til denne historie sendes til tip@version2.dk
Kommentarer (6)
sortSortér kommentarer
  • Ældste først
  • Nyeste først
  • Bedste først
Anders Kvist

Vi har gjort næsten det samme, dog i lidt mindre skala. Skiftede et diskarray med 12 SCSI diske ud med 2 stks X25-E og fik meget hurtigere responses på en af vores meget pressede database servere - har ikke lige nogle målinger, men det var tydeligt. Og det bruger væsenligt mindre strøm...

I dag er X25-E baseret på SLC hvor X25-M er baseret på MLC. Intel har besluttet at skifte til en EMLC (Enterprise MLC) løsning på fremtidige X25-E, så er lidt spændt på hvordan de bliver rent hastighed og holdbarhedsmæssigt...

/Anders

  • 0
  • 0
Toke Eskildsen

Overordnet set er jeg med på at TRIM er en god ting, men lige her har det næppe det store at sige.

En reduktion fra 40 til 8 sekunder er "kun" 5 gange hastighedsforøgelse. Hvis ellers størstedelen af I/O-operationerne er random access (hvad jeg ville forvente ud fra beskrivelsen) er SSD i sig selv langt mere end 5 gange hurtigere end harddisks. Jeg tipper derfor at størstedelen af de 8 sekunder er selve dataprocessering og derfor vil nedsættelsen af SSD-hastigheden som følge af tilsanding næppe kunne mærkes i praksis.

  • 0
  • 0
Jesper Krogh

Dertil kommer at "tilsandingen" primært (hvis ikke udelukkende) rammer skrivninger og ikke læsninger. (naturligt da det er wear-levelling algoritmen der er i spil).

På skrivesiden skriver vi i forvejen ind i en battery-backed raid-controller, så tilsandingen rammer os først når der kommer mere end 256MB data i en strøm hurtigere end diskene kan sluge dem.

.. tanken var.. at man kunne hive diskene ude en efter en og kører ATA SECURE ERASE på dem i ny og næ.. men det bliver næppe til i praksis.

Jesper

  • 0
  • 0
Thomas Schmidt

Dertil kommer at "tilsandingen" primært (hvis ikke udelukkende) rammer skrivninger og ikke læsninger

Dette er ikke helt korrekt, lidt afhængigt af hvilken producent der har lavet drevet og hvilke controller der benyttes sker der også read performance degradation, i X25-M's tilfælde viser tests at det kan falde med en 10%-15%. Men ja, det er mest write performance der dør over tid. Har dog personligt oplevet større fald i læse performance med billigere OCZ, men det var til test og er ikke drev i samme klasse som Intels imho.

ATA SECURE ERASE er ikke det samme som TRIM og vil kun i nogle tilfælde med visse drev give samme "friske" performance som efter en TRIM, dog mener jeg at denne strategi virker med Intels drev. En anden løsning kunne jo være at smide diskene i en Win7 maskine og TRIM'e dem :)

Jeg kan dog kun bifalde brugen af SSD drev i database servere, har selv personligt oplevet helt vanvittige performance gains i diverse database setups (Oracle og SQL Server). Prisen på drevene er dog desværre stadig i et leje hvor kun få kan eller vil være med.

  • 0
  • 0
Per Lolk

Der findes i dag enterprise storage, der kombinerer fordelene fra SSD-diske med en mere økonomisk overkommelige Fibrechannel diske. Disse herlige systemer finder så selv ud af "bruge" SSD der hvor de gør mest gavn.

På den måde får man både den høje performance og enterprise disksystemernes høje tilgængelighed til en overkommelig pris.

  • 0
  • 0
Log ind eller Opret konto for at kommentere