Torben Mogensen header

To bacheloruddannelser i data science -- en sammenligning

IT-Universitetet har for nylig annonceret, at de til sommer starter en uddannelse i data science, angiveligt Danmarks første. Selv dette teknisk set er korrekt -- det er den første uddannelse med selvstændigt optag, så er det ikke det eneste sted i Danmark, hvor man kan uddanne sig indenfor data science. Dels har man længe kunnet specialisere sig indenfor området på kandidatuddannelsen i datalogi på Københavns Universitet, og på flere kandidatuddannelser på DTU.

Men indtil nu, har der mig bekendt ikke være deciderede specialiseringer i data science på bacheloruddannelser. Men studerende, der optages på bacheloruddannelsen i datalogi på Københavns Universitet fra sommer 2017 (samtidig med optaget på ITUs data-science uddannelse) kan vælge en omfattende specialisering i data science. Studiesiderne for bacheloruddannelsen er endnu ikke opdateret med denne specialisering, så jeg vil benytte denne blog til at informere eventuelt interesserede om specialiseringen og sammenligne den med uddannelsen på ITU. Denne sammenligning bygger på den offentliggjorte information om ITUs uddannelse og på min egen viden (som studieleder) om specialiseringen på KU.

Jeg vil specifikt sammenligne omfanget af hhv. datalogi (programmering, algoritmer, systemer, interaktionsdesign, osv), matematik (algebra, analyse, statistik og diskret matematik), data science (som egentlig er underområder af matematik og datalogi, men indeholder emner som machine learning, dataanalyse, og data visualisering), og valgfri kurser.

Begge uddannelser er på 180 ECTS point, altså tre årsværk, hvoraf 150 er (når man har valgt data science specialiseringen/-uddannelsen) er obligatorisk. De resterende 30 ECTS point er på KU helt valgfri og på ITU opdelt i 15 ECTS helt valgfri fag og 15 ECTS begrænset valgfri fag, dvs. at man har et lille antal kurser at vælge imellem.

Den obligatoriske del af ITUs uddannelse opdeler sig som følger:

  • 82,5 ECTS point datalogi
  • 52,5 ECTS point data science
  • 15 ECTS point matematik.

Tallene er ikke præcise, da der er kurser, der omfatter flere emner. Endvidere kan det forventes, at de tre store projekter (3×15 ECTS point) vil omhandle anvendelser af data science.

I KUs data science specialisering er opdelingen som følger:

  • 82,5 ECTS point datalogi
  • 45 ECTS point data science
  • 22,5 ECTS point matematik

Igen er der blandede kurser og projekter, der forventes at omhandle data science. Men alt i alt er der ikke den store forskel i opdelingen -- der er i ITUs uddannelse en smule mere data science og lidt mindre matematik sammenlignet med specialiseringen fra KU, men da data science bruger en del matematik, kan det tænkes, at en del af matematikken på ITU blot er indeholdt i deres data science kurser. Der er også i data science kurserne på KU en del "skjult" matematik, så det er ikke usandsynligt. Uanset, om man vælger uddannelsen fra ITU eller specialiseringen fra KU, kan dele af den (begrænsede) valgfri del bruges til at tage kurser efter eget valg i datalogi, matematik eller data science -- eller helt andre emner, og man kan på de respektive kandidatuddannelser vælge avancerede kurser indenfor data science.

Når de to uddannelsestilbud er så ens, hvilken skal man så som studerende vælge? Jeg vil på trods af at jeg er en smule forudindtaget ( * host * ) forsøge at lave en fair sammenligning, men tag alligevel mine udsagn med et gran salt.

  • På ITU er data science en uddannelse, mens man på KU først indskrives på datalogi og først sidst på første studieår vælger sin specialisering.
  • På ITU er der i 2017 50 pladser på data science uddannelsen. På KU er planerne i 2017 at optage over 200 studerende på datalogi, og der vil ikke være begrænsning på hvor mange, der kan vælge specialiseringen i data science.
  • Adgangssnittet for datalogi på KU lå i 2016 på 7,4, hvor bacheloruddannelsen i softwareudvikling på ITU havde et adgangssnit på 7,3. Det er nogenlunde det samme, men da data science er en ny uddannelse, og optaget på datalogi på KU sættes op fra 170 til over 200, kan det være svært at forudsige, hvor snittene ender.
  • På ITU har data science uddannelsen en smule mere fokus på analyse af web data og finansielle data, mens der på KU er en smule mere fokus på analyse af billeder og videnskabelig data. Man kan i begge tilfælde dog vælge eget fokus for projekterne og analysere alt fra computerspil til kunstværker og litterære tekster.
  • Datalogisk Institut på Københavns Universitet (DIKU) har flere forskere end ITU, der specialiserer sig indenfor data science og relaterede emner. Sammenlign DIKUs forskergrupper med dem på ITU. Se på de enkelte gruppers fokus og publikationer for at få det præcise billede.

Men, som sagt, så er det et billede, der er farvet lidt af mit bedre kendskab til DIKU end ITU, og folk med bedre kendskab til ITUs uddannelse skal være velkommen til at rette eventuelle fejl og misforståelser.

Så det bedste entydige råd jeg kan give er, at uanset hvilken af de to muligheder, du som studerende vælger som første prioritet, så vælg den anden mulighed som næste prioritet.

Kommentarer (5)
sortSortér kommentarer
  • Ældste først
  • Nyeste først
  • Bedste først
Rasmus Pagh

Det er meget positivt, at bachelorstuderende i datalogi fremover vil kunne specialisere sig i data science. På ITU overvejede vi også, om data science kunne være en specialisering på vores bacheloruddannelse i softwareudvikling, men kom frem til at det ville føre til for mange kompromiser i forhold til, hvad vi ser som den ideelle uddannelse i data science. Vores uddannelse fokuserer således på data science i alle fag fra dag 1 og er bredere orienteret, end hvad der kan rummes i en uddannelse i datalogi eller softwareudvikling. Når det er sagt, er der ingen tvivl om, at Danmark i de kommende år har behov for alle de højtuddannede it-specialister, vi på universiteterne kan levere.

  • 3
  • 0
Torben Mogensen Blogger

Vi har på datalogiuddannelsen allerede kurser i lineær algebra, matematisk analyse og statistik, samt dataanalyse og -modellering, så det har nok været lidt nemmere for os at passe en specialisering ind i den nuværende uddannelse end det har været for jer at gøre det samme med softwareudvikling, som ikke har nogen af delene.

Vi overvejede også at lave en separat uddannelse, men dels tager det længere tid at få igennem (da KU ikke endnu er institutionsakkrediteret), og dels ville vi i givet fald foretrække en helt engelsksproget uddannelse for at trække internationale studerende til, men KU tillader p.t. ikke engelsksprogede bacheloruddannelser, så det ville også tage lidt tid at få en sådan tilladelse igennem. Der er fordele ved at være et så lille universitet som ITU.

  • 1
  • 0
Mikkel Meyer Andersen

Det bliver spændende at følge tiltaget.

Ved første øjekast kunne 22,5 ECTS points matematik (algebra, analyse, statistik og diskret matematik) lyde af lidt i forhold til de næsten 4 gange så mange ECTS point i datalogi.

Hvilke overvejelser har I gjort i denne forbindelse? Er uddannelsen sammensat sammen med matematikere og statistikere eller udelukkende forankret i datalogi?

Når man hører om data science og fra data scientists (også internationalt), synes jeg ikke det er sjældent, at statistikken måske bliver underprioriteret. Hvis man har problemer med korrelationsbegrebet, p-værdier, simple lineære normale modeller eller eksempelvis logistisk regression, får man det svært. Og min bekymring går på, om der er afsat nok tid til at de studerende får en dyb nok indsigt i statistik til at kunne behandle eksempelvis sådanne koncepter.

Nu er mit spørgsmål muligvis også en kende farvet, da jeg selv er statistiker (jeg er adjunkt i anvendt statistik på et af dette lands andre universiteter, men skriver i personligt regi). Men idéen er som sagt bare at blive klogere på, hvilke overvejelser I har gjort i forbindelse med andelen af datalogi kontra andelen af matematik.

VH. Mikkel.

  • 0
  • 0
Torben Mogensen Blogger

Specialiseringen laves i samarbejde med Institut for Matematiske Fag på KU, så det matematiske grundlag skulle gerne være i orden. De 22,5 ECTS point, jeg nævnte, er deciderede matematikkurser, som også deles med den generelle profil i datalogi. De nye data science kurser kommer til at indeholde den nødvendige ekstra matematik, især statistik.

En udfordring er, at statistikundervisningen på IMF er baseret på målteori, mens vi gerne ser en mere klassisk og anvendt tilgang til faget i forbindelse med data science. Jeg har selv bifag i matematik, så mål- og integralteori skræmmer mig ikke, men de folk på DIKU, der arbejder med data science ser hellere en anden tilgang. Men det er medvirkende til, at vi ikke bare inkluderer statistikkurser fra matematikuddannelsen, men bygger statistikken ind i data science kurser.

  • 3
  • 0
Log ind eller Opret konto for at kommentere