Danmarks Statistik vil eksperimentere med populært open source-sprog

13. juni 2016 kl. 06:287
Programmeringssproget R skal afprøves hos Danmarks Statistik. Vi skal være åbne for omverdenen, fortæller it-chef.
Artiklen er ældre end 30 dage
Manglende links i teksten kan sandsynligvis findes i bunden af artiklen.

Danmarks Statistik har taget det populære open source-sprog og statistikplatform R ind i folden og vil teste sproget på enkelte analyseopgaver.

Den nationale statistik-institution bruger primært det proprietære sprog Statistical Analytics Systems - eller SAS. Men der er flere grunde til at supplere med R, fortæller Annie Stahel, der er it-chef i Danmarks Statistik.

»Vi kan se, at mange fra universiteterne kommer ud med kendskab til R. Og vi kan se at det bliver brugt i stigende grad til analyseopgave i Danmark og i organisationer som vores i andre europæiske lande,« fortæller hun til Version2.

Hvad er R?

R er både et sprog og et miljø for statistik- og grafikarbejde. The R Foundation, der står for udviklingen af sproget, foretrækker selv at kalde R for et miljø med indbyggede statistiske teknikker.

R er bygget meget lig sproget S, og meget kode skrevet i S kan køre uændret i R. Hvis behovet opstår, kan R kædes kode i både C, C++ og Fortran.

R er et GNU project og er frit tilgængeligt under GNU General License.

Kilde: R-project.org

Eksploderet i popularitet

Statistiksproget R er eksploderet i popularitet over en årrække. Tiobe-indekset rangerer hver måned programmeringssprogs popularitet på baggrund af kurser, tredjepartsforhandlere og it-professionelles evner.

Artiklen fortsætter efter annoncen

Her er R i skrivende stund verdens 16. mest populære programmeringssprog. Når det samtidig har vundet indpas på universiteterne, er det værd at afprøve, lyder vurderingen hos Danmarks Statistik.

»Vi vil gerne være åbne for omverdenen, så nu vil vi afprøve R,« fastslår Annie Stahel.

Ikke på vej til at udskifte SAS

På Tiobe-indekset slår R også SAS, der må leve med en 25.-plads. Trods prisen på 0 kroner for R-platformen er Danmarks Statistik dog ikke på udkig efter at erstatte den primære platform.

»Der er på ingen måder tale om et skifte fra SAS til R,« understreger Annie Stahel.

I stedet skal R først og fremmest afprøves med forskellige analytiske opgaver. Her er R blandt andet blevet brugt i fejlsøgning i statistiske data for at identificere fejl, inden man fortolker statistikken.

Det er endnu for tidligt at sige, hvor mange opgaver R kan overtage, mener Annie Stahel.

»Det er eksperimentelt. Vi prøver det, og så vil vi afgøre, hvilke muligheder vi ser i det,« siger it-chefen.

7 kommentarer.  Hop til debatten
Denne artikel er gratis...

...men det er dyrt at lave god journalistik. Derfor beder vi dig overveje at tegne abonnement på Version2.

Digitaliseringen buldrer derudaf, og it-folkene tegner fremtidens Danmark. Derfor er det vigtigere end nogensinde med et kvalificeret bud på, hvordan it bedst kan være med til at udvikle det danske samfund og erhvervsliv.

Og der har aldrig været mere akut brug for en kritisk vagthund, der råber op, når der tages forkerte it-beslutninger.

Den rolle har Version2 indtaget siden 2006 - og det bliver vi ved med.

Debatten
Log ind eller opret en bruger for at deltage i debatten.
settingsDebatindstillinger
6
13. juni 2016 kl. 13:50

Det eneste der kan undre er hvorfor dette værktøj først testes nu!

Offentlige institutioner bør helt naturligt benytte åbne standarder og (videst muligt) bidrage til og benytte Open Source.

5
13. juni 2016 kl. 13:34

Jeg arbejder dagligt med R og har kendskab til bl.a Stata (men ikke SAS).

Udover at R er et utroligt fleksibelt statistisk udviklingsmiljø i sig selv, kan man uden videre tilføje funktionalitet via en lang række større og mindre moduler -- som der findes et hav af. Jeg skal kun fremhæve to: ggplot2 og shiny.

Med ggplot2 kan man producerer nogle helt utroligt flotte (og komplekse) grafer med relativt få liniers kode.

Med shiny som kan man generere dynamiske hjemmesider baseret på rå-data og statistiske analyser.

..eksempler? Bare prøv at google .. og du vil blive imponeret.

Prøv også at søge på Hans Rosling og Debunking third-world myths på youtube ... så bliver det ikke flottere!

Jeg har ikke brug for helt så avanceret grafik ifm min forskning, men R giver mulighed for at sammenflette almindelig tekst og de statistiske analyser i én samlet kode -- f.eks R-Markdown eller LaTeX. R kode kan også indlejres i LibreOffice Writer dokumenter.

På den led bliver R det oplagte valg hvis man som forsker har fokus på 'reproducible research'.

Jeg skal ikke kloge mig i DS' behov eller SAS muligheder, men man skal bestemt ikke undervurdere R!

4
13. juni 2016 kl. 11:46

Jeg havde kursus, hvor vi brugte R, med nogen, der havde kendskab til SAS. Her var det meget tydeligt, at man var forundret over hvor fleksibelt et sprog kunne være. Det var bl.a. muligheden for bare lige at downloade et specialmodul uden at skulle betale for en ekstralicens, der blev betragtet som overraskende - ikke så meget pga. prisen, men mere pga. mindre bøvl.

Så når DS siger: "Der er på ingen måder talte om et skifte fra SAS til R," så tror jeg, at de ret hurtigt vil finde ud af, at al nyudvikling kommer til at foregå i R istedet for i SAS.

Held og lykke herfra - og en opfordning om, at publicere jeres egne moduler, så andre også kan få glæde af dem.

3
13. juni 2016 kl. 10:22

...det er faktisk et programmeringssprog. Det opfylder alle kriterier dertil, og kan også anvendes til general purpose-udvikling hvis man virkelig har lyst. Deri adskiller det sig fra fx SPSS fra IBM. Der er ingen tvivl om, at det har mange domænespecifikke features til statistik i bredeste forstand (fra maskinlæring til simpel regression), men det er et egentligt programmeringssprog.

Lidt i stil med LISP, som oprindeligt var pitchet til AI-udvikling fra McCarthy's (udviklerens) side; AI var i øvrigt et udtryk, han opfandt. Der er næsten ingen, der bruger det til den specifikke anvendelse mere, men til gengæld har det fået nyt liv i tusinder af andre anvendelser; for eksempel anvendes en variant (Racket) som playground-sprog til Oculus VR-platformen...

2
13. juni 2016 kl. 09:02

Man kunne argumentere for, at det er et programmeringssprog, som de bl.a. skriver i titlen på Wikipedia (#TroværdigKilde#1), og i deres første linje:

R is a programming language ...

1
13. juni 2016 kl. 08:49

Et super værktøj til statistik og statistisk vurdering.