AAU lancerer Claaudia-projekt med ny AI-supercomputer

Cloud Storage-delen af Claaudia lever 7,2 petabyte lagerplads til Aalborg Universitets forskere. Illustration: Aalborg Universitet
Aalborg Universitets nye IT-infrastrukturprojekt Claaudia skal levere lagerplads, regnekraft og rådgivning til Aalborg Universitets forskere.

Aalborg Universitet har lanceret projektet Claaudia, som leverer IT-infrastruktur til forskere på universitet. Som en del af projektet har de indkøbt en ny supercomputer, som er specielt velegnet til at lave beregninger til kunstig intelligens.

Ud over supercomputeren, omfatter Claaudia også et data storage-system, som skal hjælpe forskere med håndtere og sikre forskningsdata, og en rådgivningsfunktion som skal hjælpe forskere med at gøre brug af systemerne.

»Før i tiden var eksperimenter noget, der primært skete i laboratorier, men i dag er der mange eksperimenter, der kun kan foretages i Computeren,« fortæller seniorkonsulent Bo Bai, som er ansvarlig for den tekniske udformning af Claaudia.

»Det gælder for eksempel for klimamodeller. Vi har ikke så mange planeter, vi kan eksperimentere med, så det skal ske i computeren.«

Skal give computere bedre øjne

En af dem, som glæder sig til at gøre brug af de muligheder, Claaudia åbner op for, er professor i computervision ved Institut for Arkitektur og Medieteknologi, Thomas Moeslund.

»Vi kan i dag godt sætte en maskine op til at lave vores udregninger, men der er mange udfordringer med det. Fx praktikaliteter som at den fylder, larmer og varmer, da den skal køles« siger han.

»Det lyder rigtigt godt, at få adgang til et centraliseret system.«

Thomas Moeslund forsker computervision – billedgenkendelse i computere – som blandt andet kan bruges til at genkende personer i overvågningsfilm og foretage automatisk kvalitetssikring af varer i produktionsvirksomheder.

Computervision gør brug af maskinlæring via neurale netværk, og derfor ser Thomas Moeslund specielt frem til den store regnekraft, den nye supercomputer giver adgang til. Det er nemlig en meget udregningstung opgave at træne et neuralt netværk.

»Tingene kommer til at gå hurtigere, og det har ofte værdi i sig selv. Men mere interessant er det, at vi nogle gange bliver nødt til at stoppe vores træning, før modellen har konvergeret. Det kommer vi til at slippe for.«

Den større regnekraft vil også gøre det muligt at træne neurale netværk fra bunden, i stedet for at tilpasse allerede trænede netværk til det specifikke problem. Det kan i visse tilfælde give mere præcise resultater.

»Det man typisk gør, er at finde en arkitektur og et pre-trænet netværk, fx fra Microsoft eller Google, og så tager man sine egne træningsdata og laver transfer learning. Det går dybest set ud på, at 'den problemstilling, netværket løser, minder nok en lille smule om min problemstilling, så hvis jeg bare træner de sidste par lag, eller med en meget lav learning rate til hele netværket, så kan det virke'.«

»Men ved at have adgang til sådan en supercomputer kan vi gentræne netværkene helt fra bunden. Det er slet ikke noget vi har tænkt over før, for så bliver man bare træt på forhånd,« siger Thomas Moeslund.

Hjælp til GDPR-kvaler

Et andet element i projektet, Thomas Moeslund ser frem til, er hjælpen med datahåndtering.

»Jeg ser meget frem til datahåndteringsdelen, som gør at jeg ikke skal forholde mig til GDPR hver eneste gang vi arbejder med videodata. Hvordan sikrer vi, at vi gemmer dataene ordentligt? «

»Vi har for nylig afsluttet et treårigt EU-trafikforskningsprojekt, hvor vi skulle tælle, hvor mange gange der næsten var ulykker ved lyskryds i fem EU-lande. Det måtte vi stort set opgive. Tyskland måtte vi helt opgive, og i Sverige måtte vi kun optage med termisk kamera.«

Thomas Moeslund håber, at når Claaudias datahåndtering bliver udrullet, kan det gøre det lettere at sikre, at GDPR-regler bliver overholdt.

»Det er jo op ad bakke for mig hver gang, jeg kan jo ikke huske alle reglerne. Men har vi nogle folk som er klædt på til at hjælpe os, fordi det er en del af deres dagligdag. Det tror jeg bliver rigtigt fint.«

Illustration: Aalborg Universitet

Regnekraft og lagerplads

Aalborg Universitets nye supercomputer består af tre af NVidia DGX-2 AI Research System-computere koblet sammen. Hver maskine indeholder 16 GPU’er koblet sammen med en NVSwitch, som gør det muligt, at dele regneopgaver
mellem enhederne meget hurtigt. De leverer tilsammen 6 petaflops, og er så tunge, at de skal løftes ind i rackskabet med en speciel lift.

Systemet kører cloud-styresystemet Openstack til at forbinde serverne, der hver især kører Linux. Til at håndtere forskningsdata bruger Claaudia cloud storage-systemet CEPH.

»På nuværende tidspunkt består vores cloud storage system af 40 nodes, som er almindelige servere, der er koblet sammen med systemet CEPH,« fortæller Bo Bai.

»I øjeblikket har vi 7,2 petabyte lagerplads, men det kan skaleres op. Det store fokus for os er throughput. Indtil videre, har vi ikke været i stand til at belaste systemet til fuld kapacitet i vores tests.«

Tips og korrekturforslag til denne historie sendes til tip@version2.dk
Kommentarer (0)
sortSortér kommentarer
  • Ældste først
  • Nyeste først
  • Bedste først
Log ind eller Opret konto for at kommentere
IT Company Rank
maximize minimize