Danmarks Statistik vil eksperimentere med populært open source-sprog

Programmeringssproget R skal afprøves hos Danmarks Statistik. Vi skal være åbne for omverdenen, fortæller it-chef.

Danmarks Statistik har taget det populære open source-sprog og statistikplatform R ind i folden og vil teste sproget på enkelte analyseopgaver.

Den nationale statistik-institution bruger primært det proprietære sprog Statistical Analytics Systems - eller SAS. Men der er flere grunde til at supplere med R, fortæller Annie Stahel, der er it-chef i Danmarks Statistik.

Læs også: C vinder igen over Java som verdens mest populære sprog

»Vi kan se, at mange fra universiteterne kommer ud med kendskab til R. Og vi kan se at det bliver brugt i stigende grad til analyseopgave i Danmark og i organisationer som vores i andre europæiske lande,« fortæller hun til Version2.

Eksploderet i popularitet

Statistiksproget R er eksploderet i popularitet over en årrække. Tiobe-indekset rangerer hver måned programmeringssprogs popularitet på baggrund af kurser, tredjepartsforhandlere og it-professionelles evner.

Her er R i skrivende stund verdens 16. mest populære programmeringssprog. Når det samtidig har vundet indpas på universiteterne, er det værd at afprøve, lyder vurderingen hos Danmarks Statistik.

Læs også: Danmarks Statistik afviser frådseri: Vi har en effektiv it-drift

»Vi vil gerne være åbne for omverdenen, så nu vil vi afprøve R,« fastslår Annie Stahel.

Ikke på vej til at udskifte SAS

På Tiobe-indekset slår R også SAS, der må leve med en 25.-plads. Trods prisen på 0 kroner for R-platformen er Danmarks Statistik dog ikke på udkig efter at erstatte den primære platform.

»Der er på ingen måder tale om et skifte fra SAS til R,« understreger Annie Stahel.

Læs også: Googles open-source værktøj til machine learning får markant overhaling

I stedet skal R først og fremmest afprøves med forskellige analytiske opgaver. Her er R blandt andet blevet brugt i fejlsøgning i statistiske data for at identificere fejl, inden man fortolker statistikken.

Det er endnu for tidligt at sige, hvor mange opgaver R kan overtage, mener Annie Stahel.

»Det er eksperimentelt. Vi prøver det, og så vil vi afgøre, hvilke muligheder vi ser i det,« siger it-chefen.

Tips og korrekturforslag til denne historie sendes til tip@version2.dk
Følg forløbet
Kommentarer (7)
sortSortér kommentarer
  • Ældste først
  • Nyeste først
  • Bedste først
David Christensen

...det er faktisk et programmeringssprog. Det opfylder alle kriterier dertil, og kan også anvendes til general purpose-udvikling hvis man virkelig har lyst. Deri adskiller det sig fra fx SPSS fra IBM. Der er ingen tvivl om, at det har mange domænespecifikke features til statistik i bredeste forstand (fra maskinlæring til simpel regression), men det er et egentligt programmeringssprog.

Lidt i stil med LISP, som oprindeligt var pitchet til AI-udvikling fra McCarthy's (udviklerens) side; AI var i øvrigt et udtryk, han opfandt. Der er næsten ingen, der bruger det til den specifikke anvendelse mere, men til gengæld har det fået nyt liv i tusinder af andre anvendelser; for eksempel anvendes en variant (Racket) som playground-sprog til Oculus VR-platformen...

  • 7
  • 0
Ole Tange Blogger

Jeg havde kursus, hvor vi brugte R, med nogen, der havde kendskab til SAS. Her var det meget tydeligt, at man var forundret over hvor fleksibelt et sprog kunne være. Det var bl.a. muligheden for bare lige at downloade et specialmodul uden at skulle betale for en ekstralicens, der blev betragtet som overraskende - ikke så meget pga. prisen, men mere pga. mindre bøvl.

Så når DS siger: "Der er på ingen måder talte om et skifte fra SAS til R," så tror jeg, at de ret hurtigt vil finde ud af, at al nyudvikling kommer til at foregå i R istedet for i SAS.

Held og lykke herfra - og en opfordning om, at publicere jeres egne moduler, så andre også kan få glæde af dem.

  • 9
  • 0
Søren O'Neill

Jeg arbejder dagligt med R og har kendskab til bl.a Stata (men ikke SAS).

Udover at R er et utroligt fleksibelt statistisk udviklingsmiljø i sig selv, kan man uden videre tilføje funktionalitet via en lang række større og mindre moduler -- som der findes et hav af. Jeg skal kun fremhæve to: ggplot2 og shiny.

Med ggplot2 kan man producerer nogle helt utroligt flotte (og komplekse) grafer med relativt få liniers kode.

Med shiny som kan man generere dynamiske hjemmesider baseret på rå-data og statistiske analyser.

..eksempler? Bare prøv at google .. og du vil blive imponeret.

Prøv også at søge på Hans Rosling og Debunking third-world myths på youtube ... så bliver det ikke flottere!

Jeg har ikke brug for helt så avanceret grafik ifm min forskning, men R giver mulighed for at sammenflette almindelig tekst og de statistiske analyser i én samlet kode -- f.eks R-Markdown eller LaTeX. R kode kan også indlejres i LibreOffice Writer dokumenter.

På den led bliver R det oplagte valg hvis man som forsker har fokus på 'reproducible research'.

Jeg skal ikke kloge mig i DS' behov eller SAS muligheder, men man skal bestemt ikke undervurdere R!

  • 4
  • 0
Niels Bjerre

Det eneste der kan undre er hvorfor dette værktøj først testes nu!

Offentlige institutioner bør helt naturligt benytte åbne standarder og (videst muligt) bidrage til og benytte Open Source.

  • 6
  • 0
Log ind eller Opret konto for at kommentere