KU-forskere vælger skyen fra: For dyrt og for langsomt

19. april 2018 kl. 05:119
KU-forskere vælger skyen fra: For dyrt og for langsomt
Illustration: SCIENCE - Københavns Universitet.
Københavns Universitets naturvidenskabelige fakultet vil være førende inden for håndtering af forskningsdata. For at håndtere eksplosionen i forskernes datamængder har fakultetet bygget sit eget datacenter i kælderen under H.C. Ørsted Instituttet.
Artiklen er ældre end 30 dage
Manglende links i teksten kan sandsynligvis findes i bunden af artiklen.

16 petabyte – eller 16.000 terabyte. Så stor er kapaciteten lige nu i det datacenter, som Københavns Universitets naturvidenskabelige fakultet (Science) har kørende i kældrene under det hæderkronede H.C. Ørsted-institut i København.

Ud af de 16 petabyte er omkring en fjerdedel til generel afbenyttelse for alle forskere på Science.

Event: Version2 Datacenter

Sammen med Infosecurity Denmark byder Version2 Datacenter 2018 på mere end 110 seminarer og cases, 25 keynotes og 80 udstillere. To dage med masser af faglig viden og netværk d. 2. og 3. maj i Øksnehallen i København.

Version2 Datacenter er på 6. år Danmarks største event inden for datacenter- og cloudløsninger. Og på blot fem år er der sket en kæmpe udvikling.

Mængden af cloudtjenester er mangedoblet og fremtiden tjenester skal leveres på ”cloud-lignende” vilkår, uanset om man har eget datacenter, cloud eller en hybrid.

Her kan du på to dages konference hente viden til strategier på området, og på messen kan du møde førende leverandører for en konkret snak om jeres muligheder.

Flere oplysninger
Vil du gå direkte til tilmelding, klik her.

Version2 Infosecurity

It-sikkerhedsmessen Infosecurity Denmark 2018 byder på mere end 110 seminarer og cases, 25 udvalgte keynotes og 80 udstillere. To dage med masser af faglig viden og netværk d. 2. og 3. maj i Øksnehallen i København.

Konferenceprogrammet dækker både compliance, cybercrime, IoT, nye teknologier som AI og blockchain samt cloud security og giver et unikt indblik i de nyeste it-sikkerhedsmæssige udfordringer på et højt fagligt niveau.

Du bliver opdateret om både de nyeste tekniske landvindinger fra spydspidsforskere og får indblik i aktuelle trusselsbilleder fra nogle af verdens bedste rådgivere.

Flere oplysninger

Vil du gå direkte til tilmelding, klik her.

Den del af datacenteret er bygget for at kunne håndtere de eksploderende mængder af data, som er en konsekvens af, at også forskningsverdenen – både dansk og internationalt – i stigende grad er afhængig af rå regnekraft og evne til at analysere store datamængder.

Artiklen fortsætter efter annoncen

Datapuljen til fri afbenyttelse er fire år gammel, men allerede i løbet af i år forventer lederen af Sciences Center for High Performance Computing, professor Brian Vinter, at skulle udvide kapaciteten for både lagring og overførsel af forskningsdata markant.

Planen er at nå op på en samlet diskstørrelse på 12 petabyte og dataforbindelser, der kan håndtere overførsler på op til tre gange 100 Gbit.

Hjertet i Science-datacenteret er ERDA-systemet (Electronic Research Data Archive), hvor forskerne på samme måde som kendte fildelingstjenester såsom Dropbox og Google Drive kan uploade store mængder data og dele dem med andre på og uden for universitetet – bare bedre og mere sikkert.

Det gør ifølge Brian Vinter fakultetet internationalt førende indenfor udvikling af datahåndteringssystemer sammenlignet med andre universiteter i verden:

Artiklen fortsætter efter annoncen

»Før ERDA har jeg og mange af mine kolleger slæbt rundt med eksterne harddiske for at dele vores data med hinanden. Det var vildt besværligt og svært at styre, om man nu havde den nyeste version, når flere personer arbejdede med det på samme tid,« fortæller Brian Vinter.

2,5 millioner i anskaffelse

Det er store tal, men dog ikke større, end at både danske og internationale driftsleverandører forholdsvis smertefrit ville kunne levere datahåndtering i den størrelsesorden.

Så hvorfor har Science valgt at bygge sit eget fysiske datacenter, fremfor eksempelvis en standard cloudløsning?

Brian Vinter peger på både juridiske, tekniske og økonomiske årsager.

Artiklen fortsætter efter annoncen

»De løsninger og services, vi kan købe os til via eksterne leverandører, er både for dyre og for langsomme sammenlignet med en løsning, hvor vi har vores egne diske stående og snurre i kælderen. Man ville nemt kunne købe sig til en tilsvarende løsning ude i byen. Men så ville det blive til en anden pris, end de 2,5 millioner vi har investeret i vores egen hardware,« siger Brian Vinter.

Han erkender, at der ud over den rene hardware-udgift løber yderligere omkostninger på i form af manpower til vedligeholdelse og drift.

Men den helt store økonomiske gevinst ligger i, at private udbydere kræver kontant betaling for dataoverførsel pr. terabyte. Det slipper man for, når data ligger på egne diske, siger Brian Vinter.

Han peger desuden på kravet om højhastighedsforbindelser, der inden for en rimelig tid kan gnave sig igennem store datasæt fra både interne og eksterne brugere på danske og udenlandske forskningsinstitutioner.

»Endelige er der den juridiske side af sagen, hvor det er vigtigt for vores eksterne samarbejdspartnere, at deres data ligger fysisk her på KU,« siger Brian Vinter.

Universiteterne skal gå forrest

»Du kan da helt sikkert finde private leverandører, der synes, at vi tager opgaver fra dem. Men vores rolle som universitet er også at gå forrest og skabe nye specialiserede måder at håndtere store datasæt,« siger han.

»Når vi har bygget det her datacenter fra bunden, er det også på grund af tidsperspektivet. De data, der bliver lagret i dag, skal jeg også kunne levere om 10 eller 20 år, og så kan jeg ikke leve med risikoen for, at en ekstern leverandør på et tidspunkt drejer nøglen om,« siger Brian Vinter.

Han er da heller ikke bekymret for, at en ellers meget liberalt sindet forskningsminister, Søren Pind (V), skulle finde på at kræve Science-datacenteret udliciteret.

»Jeg tror, vi har en meget fornuftig minister, som ved at universiteterne skal gå forrest på lige præcis det her område,« siger Brian Vinter.

Brian Vinter holder keynote på eventet Version2 Datacenter, som afholdes d. 2. og 3. maj i Øksnehallen i København. Mere info her.

9 kommentarer.  Hop til debatten
Denne artikel er gratis...

...men det er dyrt at lave god journalistik. Derfor beder vi dig overveje at tegne abonnement på Version2.

Digitaliseringen buldrer derudaf, og it-folkene tegner fremtidens Danmark. Derfor er det vigtigere end nogensinde med et kvalificeret bud på, hvordan it bedst kan være med til at udvikle det danske samfund og erhvervsliv.

Og der har aldrig været mere akut brug for en kritisk vagthund, der råber op, når der tages forkerte it-beslutninger.

Den rolle har Version2 indtaget siden 2006 - og det bliver vi ved med.

Debatten
Log ind eller opret en bruger for at deltage i debatten.
settingsDebatindstillinger
9
19. april 2018 kl. 12:59

Skulle man begynde fra bunden og opbygge serverrum og kompetencer og ansætte folk ville beregningen se helt anderledes ud!

Det burde jo ikke være en issue at investere, der burde man jo kunne 'afskrive' investeringerne over et passende antal år. Jeg ved så godt at 'burde' i den her kontekst når vi snakker offentlig 'aktivitet', ikke er et så klart 'burde', som når det kommer til private virksomheder.

Men ellers så har jeg også svært ved at se at med de kapacitets behov man har her.. så er 'taxa kørsel' nok ikke lige vejen frem.

Når det så er sagt, så er der jo ikke noget galt for, at man rent teknologisk voldbruger f.eks. en open CloudStack internt.

// Jesper

8
19. april 2018 kl. 10:43

...der så kommer en eller anden og fortæller dem at det ikke kan være rigtigt... ...og at det helt sikkert ikke er sikkert for det er jo kun på en lokation... skyen er jo overalt.

Bemærk venligst at det ikke er min holdning.

7
19. april 2018 kl. 10:10

God beslutning!

6
19. april 2018 kl. 10:01

Det er rigtigt - desværre er den beregning ret elastisk:) Vi har et data-center i forvejen så i vores interne beregnigner er det kun den ekstra udgift ved også at køre ERDA der fremgår, det er meget lidt. Tager man ERDA's andel af centerets totale HW er det endnu mindre. (vi taler om mindre end 100kkr om året).

Skulle man begynde fra bunden og opbygge serverrum og kompetencer og ansætte folk ville beregningen se helt anderledes ud!

5
19. april 2018 kl. 09:39

Tak for svar, Brian Vinter.

altså ikke persondata etc

Men det er mit over lang tid opsamlede indtryk - kan ikke lige ryste links ud af ærmet - at det faktisk også ofte foregår på den måde nogen steder i det offentlige mht. stærkt følsomme persondata. Måske er det ved at blive bedre - det kan man da håbe.

Måske får vi svar på det i TV2's fokus på sagen i aften kl. 20.50 "Hackerne angriber os".

4
19. april 2018 kl. 09:27

Hejsa,

Hvor er svaret på overskriften "KU-forskere vælger skyen fra: For dyrt og for langsomt"?

Der er ingen sammenligninger og man fremhæver kun 2,5miokr, uden at tage hensyn til alle de andre omkostninger ved at have et datacenter :)

Mvh Søren

3
19. april 2018 kl. 09:15

"Besværligt? Det lyder heller ikke særligt sikkert..."

Det var bestemt ikke sikkert! De skal lige nævnes at de data der tidligere blev fragtet rundt på USB medier ikke var underlagt nogen regulering (altså ikke persondata etc), men stadigt kunne repræsentere en substantiel værdi.

Omkring hvorfor det er vigtigt at data ligger på KU (i modsætning til en ekstern skyløsning) skal man lige huske at SCIENCE har mange samarbejdspartnere, nogle er ret ubekymrede omkring deres data mens andre er ekstremt kritiske omkring lagerløsninger (begge versioner findes så i to varianter; dem der har gennemtænkt problemet og dem der ikke har:)). Slutproduktet er dog at når KU siger god for vores løsning så er alle (så langt) glade.

ERDA er pt kun til ikke personhenførbare data, men en speciel GDPR version er under opbygning.

2
19. april 2018 kl. 08:58

For hvis det er noget med sikkerhed, så er det jo et godt argument for, at man skal bruge denne opskrift alle steder, hvor det offentlige behandler forskningsdata, såsom sundhedsdata.

Klart - Det er bare pokkers svært at bruge data som man har lyst, hvis man skal spørge både den ene og den anden, for at få adgang. Det harmonerer ikke med den pt. voldsomme trang til at vide alt om alle, der hersker blandt dataindustri og politikere...

1
19. april 2018 kl. 07:10

"Før ERDA har jeg og mange af mine kolleger slæbt rundt med eksterne harddiske for at dele vores data med hinanden. Det var vildt besværligt og svært at styre, om man nu havde den nyeste version, når flere personer arbejdede med det på samme tid,« fortæller Brian Vinter."

Besværligt? Det lyder heller ikke særligt sikkert...

"Endelige er der den juridiske side af sagen, hvor det er vigtigt for vores eksterne samarbejdspartnere, at deres data ligger fysisk her på KU,« siger Brian Vinter."

Og hvorfor så det? For hvis det er noget med sikkerhed, så er det jo et godt argument for, at man skal bruge denne opskrift alle steder, hvor det offentlige behandler forskningsdata, såsom sundhedsdata. Fragt rundt på eksterne harddiske og usb-sticks bør vel så simpelthen forbydes i de sammenhænge?