KU-forskere vælger skyen fra: For dyrt og for langsomt

Illustration: SCIENCE - Københavns Universitet
Københavns Universitets naturvidenskabelige fakultet vil være førende inden for håndtering af forskningsdata. For at håndtere eksplosionen i forskernes datamængder har fakultetet bygget sit eget datacenter i kælderen under H.C. Ørsted Instituttet.

16 petabyte – eller 16.000 terabyte. Så stor er kapaciteten lige nu i det datacenter, som Københavns Universitets naturvidenskabelige fakultet (Science) har kørende i kældrene under det hæderkronede H.C. Ørsted-institut i København.

Ud af de 16 petabyte er omkring en fjerdedel til generel afbenyttelse for alle forskere på Science.

Den del af datacenteret er bygget for at kunne håndtere de eksploderende mængder af data, som er en konsekvens af, at også forskningsverdenen – både dansk og internationalt – i stigende grad er afhængig af rå regnekraft og evne til at analysere store datamængder.

Datapuljen til fri afbenyttelse er fire år gammel, men allerede i løbet af i år forventer lederen af Sciences Center for High Performance Computing, professor Brian Vinter, at skulle udvide kapaciteten for både lagring og overførsel af forskningsdata markant.

Planen er at nå op på en samlet diskstørrelse på 12 petabyte og dataforbindelser, der kan håndtere overførsler på op til tre gange 100 Gbit.

Hjertet i Science-datacenteret er ERDA-systemet (Electronic Research Data Archive), hvor forskerne på samme måde som kendte fildelingstjenester såsom Dropbox og Google Drive kan uploade store mængder data og dele dem med andre på og uden for universitetet – bare bedre og mere sikkert.

Det gør ifølge Brian Vinter fakultetet internationalt førende indenfor udvikling af datahåndteringssystemer sammenlignet med andre universiteter i verden:

»Før ERDA har jeg og mange af mine kolleger slæbt rundt med eksterne harddiske for at dele vores data med hinanden. Det var vildt besværligt og svært at styre, om man nu havde den nyeste version, når flere personer arbejdede med det på samme tid,« fortæller Brian Vinter.

2,5 millioner i anskaffelse

Det er store tal, men dog ikke større, end at både danske og internationale driftsleverandører forholdsvis smertefrit ville kunne levere datahåndtering i den størrelsesorden.

Så hvorfor har Science valgt at bygge sit eget fysiske datacenter, fremfor eksempelvis en standard cloudløsning?

Brian Vinter peger på både juridiske, tekniske og økonomiske årsager.

»De løsninger og services, vi kan købe os til via eksterne leverandører, er både for dyre og for langsomme sammenlignet med en løsning, hvor vi har vores egne diske stående og snurre i kælderen. Man ville nemt kunne købe sig til en tilsvarende løsning ude i byen. Men så ville det blive til en anden pris, end de 2,5 millioner vi har investeret i vores egen hardware,« siger Brian Vinter.

Han erkender, at der ud over den rene hardware-udgift løber yderligere omkostninger på i form af manpower til vedligeholdelse og drift.

Men den helt store økonomiske gevinst ligger i, at private udbydere kræver kontant betaling for dataoverførsel pr. terabyte. Det slipper man for, når data ligger på egne diske, siger Brian Vinter.

Han peger desuden på kravet om højhastighedsforbindelser, der inden for en rimelig tid kan gnave sig igennem store datasæt fra både interne og eksterne brugere på danske og udenlandske forskningsinstitutioner.

»Endelige er der den juridiske side af sagen, hvor det er vigtigt for vores eksterne samarbejdspartnere, at deres data ligger fysisk her på KU,« siger Brian Vinter.

Universiteterne skal gå forrest

»Du kan da helt sikkert finde private leverandører, der synes, at vi tager opgaver fra dem. Men vores rolle som universitet er også at gå forrest og skabe nye specialiserede måder at håndtere store datasæt,« siger han.

»Når vi har bygget det her datacenter fra bunden, er det også på grund af tidsperspektivet. De data, der bliver lagret i dag, skal jeg også kunne levere om 10 eller 20 år, og så kan jeg ikke leve med risikoen for, at en ekstern leverandør på et tidspunkt drejer nøglen om,« siger Brian Vinter.

Han er da heller ikke bekymret for, at en ellers meget liberalt sindet forskningsminister, Søren Pind (V), skulle finde på at kræve Science-datacenteret udliciteret.

»Jeg tror, vi har en meget fornuftig minister, som ved at universiteterne skal gå forrest på lige præcis det her område,« siger Brian Vinter.

Brian Vinter holder keynote på eventet Version2 Datacenter, som afholdes d. 2. og 3. maj i Øksnehallen i København. Mere info her.

Tips og korrekturforslag til denne historie sendes til tip@version2.dk
Følg forløbet
Kommentarer (9)
Anne-Marie Krogsbøll

"Før ERDA har jeg og mange af mine kolleger slæbt rundt med eksterne harddiske for at dele vores data med hinanden. Det var vildt besværligt og svært at styre, om man nu havde den nyeste version, når flere personer arbejdede med det på samme tid,« fortæller Brian Vinter."

Besværligt? Det lyder heller ikke særligt sikkert...

"Endelige er der den juridiske side af sagen, hvor det er vigtigt for vores eksterne samarbejdspartnere, at deres data ligger fysisk her på KU,« siger Brian Vinter."

Og hvorfor så det? For hvis det er noget med sikkerhed, så er det jo et godt argument for, at man skal bruge denne opskrift alle steder, hvor det offentlige behandler forskningsdata, såsom sundhedsdata. Fragt rundt på eksterne harddiske og usb-sticks bør vel så simpelthen forbydes i de sammenhænge?

Axel Nielsen

For hvis det er noget med sikkerhed, så er det jo et godt argument for, at man skal bruge denne opskrift alle steder, hvor det offentlige behandler forskningsdata, såsom sundhedsdata.

Klart - Det er bare pokkers svært at bruge data som man har lyst, hvis man skal spørge både den ene og den anden, for at få adgang.
Det harmonerer ikke med den pt. voldsomme trang til at vide alt om alle, der hersker blandt dataindustri og politikere...

Brian Vinter

"Besværligt? Det lyder heller ikke særligt sikkert..."

Det var bestemt ikke sikkert! De skal lige nævnes at de data der tidligere blev fragtet rundt på USB medier ikke var underlagt nogen regulering (altså ikke persondata etc), men stadigt kunne repræsentere en substantiel værdi.

Omkring hvorfor det er vigtigt at data ligger på KU (i modsætning til en ekstern skyløsning) skal man lige huske at SCIENCE har mange samarbejdspartnere, nogle er ret ubekymrede omkring deres data mens andre er ekstremt kritiske omkring lagerløsninger (begge versioner findes så i to varianter; dem der har gennemtænkt problemet og dem der ikke har:)). Slutproduktet er dog at når KU siger god for vores løsning så er alle (så langt) glade.

ERDA er pt kun til ikke personhenførbare data, men en speciel GDPR version er under opbygning.

Anne-Marie Krogsbøll

Tak for svar, Brian Vinter.

altså ikke persondata etc


Men det er mit over lang tid opsamlede indtryk - kan ikke lige ryste links ud af ærmet - at det faktisk også ofte foregår på den måde nogen steder i det offentlige mht. stærkt følsomme persondata. Måske er det ved at blive bedre - det kan man da håbe.

Måske får vi svar på det i TV2's fokus på sagen i aften kl. 20.50 "Hackerne angriber os".

Brian Vinter

Det er rigtigt - desværre er den beregning ret elastisk:) Vi har et data-center i forvejen så i vores interne beregnigner er det kun den ekstra udgift ved også at køre ERDA der fremgår, det er meget lidt. Tager man ERDA's andel af centerets totale HW er det endnu mindre. (vi taler om mindre end 100kkr om året).

Skulle man begynde fra bunden og opbygge serverrum og kompetencer og ansætte folk ville beregningen se helt anderledes ud!

Jesper Frimann

Skulle man begynde fra bunden og opbygge serverrum og kompetencer og ansætte folk ville beregningen se helt anderledes ud!


Det burde jo ikke være en issue at investere, der burde man jo kunne 'afskrive' investeringerne over et passende antal år. Jeg ved så godt at 'burde' i den her kontekst når vi snakker offentlig 'aktivitet', ikke er et så klart 'burde', som når det kommer til private virksomheder.

Men ellers så har jeg også svært ved at se at med de kapacitets behov man har her.. så er 'taxa kørsel' nok ikke lige vejen frem.

Når det så er sagt, så er der jo ikke noget galt for, at man rent teknologisk voldbruger f.eks. en open CloudStack internt.

// Jesper

Log ind eller Opret konto for at kommentere
Pressemeddelelser

Welcome to the Cloud Integration Enablement Day (Bring your own laptop)

On this track, we will give you the chance to become a "Cloud First" data integration specialist.
15. nov 2017

Silicom i Søborg har fået stærk vind i sejlene…

Silicom Denmark arbejder med cutting-edge teknologier og er helt fremme hvad angår FPGA teknologien, som har eksisteret i over 20 år.
22. sep 2017

Conference: How AI and Machine Learning can accelerate your business growth

Can Artificial Intelligence (AI) and Machine Learning bring actual value to your business? Will it supercharge growth? How do other businesses leverage AI and Machine Learning?
13. sep 2017
Jobfinder Logo
Job fra Jobfinder