Danmarks Statistik vil eksperimentere med populært open source-sprog
Danmarks Statistik har taget det populære open source-sprog og statistikplatform R ind i folden og vil teste sproget på enkelte analyseopgaver.
Den nationale statistik-institution bruger primært det proprietære sprog Statistical Analytics Systems - eller SAS. Men der er flere grunde til at supplere med R, fortæller Annie Stahel, der er it-chef i Danmarks Statistik.
»Vi kan se, at mange fra universiteterne kommer ud med kendskab til R. Og vi kan se at det bliver brugt i stigende grad til analyseopgave i Danmark og i organisationer som vores i andre europæiske lande,« fortæller hun til Version2. R er både et sprog og et miljø for statistik- og grafikarbejde. The R Foundation, der står for udviklingen af sproget, foretrækker selv at kalde R for et miljø med indbyggede statistiske teknikker. R er bygget meget lig sproget S, og meget kode skrevet i S kan køre uændret i R. Hvis behovet opstår, kan R kædes kode i både C, C++ og Fortran. R er et GNU project og er frit tilgængeligt under GNU General License.Hvad er R?
Eksploderet i popularitet
Statistiksproget R er eksploderet i popularitet over en årrække. Tiobe-indekset rangerer hver måned programmeringssprogs popularitet på baggrund af kurser, tredjepartsforhandlere og it-professionelles evner.
Her er R i skrivende stund verdens 16. mest populære programmeringssprog. Når det samtidig har vundet indpas på universiteterne, er det værd at afprøve, lyder vurderingen hos Danmarks Statistik.
»Vi vil gerne være åbne for omverdenen, så nu vil vi afprøve R,« fastslår Annie Stahel.
Ikke på vej til at udskifte SAS
På Tiobe-indekset slår R også SAS, der må leve med en 25.-plads. Trods prisen på 0 kroner for R-platformen er Danmarks Statistik dog ikke på udkig efter at erstatte den primære platform.
»Der er på ingen måder tale om et skifte fra SAS til R,« understreger Annie Stahel.
I stedet skal R først og fremmest afprøves med forskellige analytiske opgaver. Her er R blandt andet blevet brugt i fejlsøgning i statistiske data for at identificere fejl, inden man fortolker statistikken.
Det er endnu for tidligt at sige, hvor mange opgaver R kan overtage, mener Annie Stahel.
»Det er eksperimentelt. Vi prøver det, og så vil vi afgøre, hvilke muligheder vi ser i det,« siger it-chefen.
