Dansk softwareudvikler afslører: Sådan kan du spore dine Facebook-venners søvnvaner
Åbne Facebook-data afslører dine og dine venners søvnvaner. Det har softwareudvikler hos e-faktura virksomheden Tradeshift, Søren Louv-Jansen, påvist med et open-source værktøj, han har gjort frit tilgængelig via kodetjenesten GitHub.
»Min pointe har været at vise, at når vi bruger de sociale medier, så lægger vi ikke bare en masse data aktivt op, men vi afslører også en masse informationer uden at tænke over det,« fortæller han.
GitHub-projektet fb-sleep-stats blev startet sidste år i forbindelse med, at Facebook gjorde en ny tjeneste messenger.com tilgængelig. Søren Louv-Jansen har for nyligt forklaret nærmere om projektet i et blogindlæg hos Medium, da han blev opmærksom på, at andre arbejdede med noget lignende.
Som det vil være flere bekendt, har Facebook en funktion, så brugerne kan se, hvornår deres venner sidst har været aktive på Facebook. Eksempelvis for fem minutter siden.
Informationen om seneste aktivitet bliver opdateret, når brugerne interagerer med Facebook og er ikke afhængig af, om chat-funktionen er slået til eller ej.
Denne information opsamler Søren Louv-Jansens værktøj hvert 10. minut. Det fungerer ved, at en bruger lader værktøjet logge ind via brugerens Facebook-profil. Herefter begynder softwaren at indsamle aktivitetsdata om den pågældende brugers venner.
Og ud fra devisen om, at flere brugere tjekker deres Facebook umiddelbart inden de går i seng, og umiddelbart efter de er vågnet, kan disse data bruges til at give et billede af, hvor meget folk sover. Simpelthen ved at se på tidsrum med længere tids inaktivitet. På den måde er det også muligt at holde generelt øje med, hvor meget og hvornår Facebook-vennerne er på det sociale medie.
»Jeg var overrasket over, hvor præcist det var, og hvor præcist et billede, man kan få af folk. Og jeg var egentlig også overrasket over, at Facebook stiller alle de data til rådighed,« fortæller Søren Louv-Jansen.
»Det passer uhyggeligt godt«
Han påpeger, at det naturligvis ikke er alle Facebook-brugere, der logger på det sociale medie, når de går i seng og står op. Eksempelvis var der en af Søren Louv-Jansens venner, der så ud til at sove 16 timer i døgnet. Det var ikke tilfældet.
Men generelt har datagrundlaget ifølge Søren Louv-Jansen vist sig at give et ganske retvisende billede af folks døgnrytmer.
»Jeg har jo spurgt mine venner: kan det passe, du står op klokken seks om morgenen? Kan det passe, du var sent oppe i går? Og det passer uhyggeligt godt.«
Egentlig er Søren Louv-Jansens slet ikke interesseret i at vide, hvornår hans eller andre folks Facebook-venner går i seng og står op.
»Jeg er faktisk imod overvågning, men der er jo kun en måde at gøre folk opmærksomme på det her, og det er ved at vise det,« siger han.
Og Søren Louv-Jansen peger i den forbindelse på, at en ting er, hvad han kan se af sparsomme data om folks Facebook-brug, det er formentlig intet mod, hvad den amerikanske virksomhed har adgang til af data om os.
»Jeg kan se, hvornår mine venner sover, og jeg kan tegne et rimeligt præcist billede af det. Men det kan Facebook også. Og det skal folk bare være klar over,« siger han og tilføjer:
»Det er jo interessant for Facebook i markedsføringssammenhæng. De kan målrette deres reklamer meget bedre, når de har indtryk af, hvem vi er.«
Scraper data fra messenger.com
Facebook stiller forskellige grænseflader til rådighed for udviklere, så det er muligt at integrere forskelligt software op mod den sociale medie-platform. I den forbindelse er det dog langt fra alle data, Facebook giver udenforstående adgang til. Eksempelvis er der ikke en grænseflade til løbende at hente oplysninger om, hvornår folk sidst har været aktive.
Når Søren Louv-Jansen alligevel har fået fat i disse data er det fordi, han - i programmeringsmæssig sammenhæng - er gået mere lavpraktisk til værks. Det vil sige, at han har hentet data ud af kildekoden bag hjemmesiden for Facebooks chat-klient messenger.com. Teknikken kaldes også scraping. Kildekoden kan alle få adgang til, eksempelvis via deres browser.
Når en bruger logger ind på messenger.com er det i den bagvedliggende kode muligt at se en liste med alle venner, og hvornår disse sidst har været aktive.
Dataene ligger i et liste-format (array) og kan uden de store problemer hentes ud og anvendes i anden sammenhæng. Tidspunktet for hvornår folk sidst har været online er angivet i Unix-tidsformatet. Det vil sige, at det nuværende tidspunkt er angivet i antallet af sekunder, der er gået siden 1. januar 1970 (UTC-tid).
Og på den baggrund er det muligt at få en ganske præcis tidsangivelse for folks online-aktiviteter.
Brugerne, der matcher 'senest aktiv'-informationen, er opført med id-numre i stedet for navne i listen i kildekoden. For at omdanne id-numrene til egentlige navne anvender Søren Louv-Jansen en af Facebooks officielle grænseflader.
Ikke Facebooks kop te
Selvom de data, Søren Louv-Jansen anvender, som sådan er frit tilgængelige for alle, der kigger i kildekoden på messenger.com, så er den danske softwareudviklers kortlægning af venners søvnmønstre ikke just noget, der er sket med Facebooks billigelse.
I hvert fald er har han efter at have blogget om GitHub-projektet for nyligt modtaget en henvendelse fra Facebook.
»De skrev til mig, at det ikke var i orden, og at det var imod deres betingelser at lave automatiseret dataindsamling. Og jeg må heller ikke opfordre andre til at gøre det. Så jeg skal fjerne alt, der handler om det her.«
På baggrund af henvendelsen har Søren Louv-Jansen føjet en note til GitHub-projektet om, at det kun er tænkt til videnskabeligt brug og ikke til at overvåge sine venner med. Derudover har han dog ikke planer om at fjerne hverken blogindlægget eller selve projektet fra GitHub.
»Nu er katten jo ude af sækken. Der er mange mennesker, der har klonet (kopieret, red.) mit projekt, så det vil ikke give så meget mening, hvis jeg tager mit ned. Der ligger flere hundrede kopier derude alligevel,« siger han.
Og desuden har Søren Louv-Jansen umiddelbart også svært ved at få øje på, hvad Facebook skal gøre ved muligheden for at tilgå aktivitetsdata om Facebook-venner, så længe den information er at læse for folk, der bruger Facebook.
Han peger dog på, at Facebook godt kunne fjerne oplysningen for folk, der har slået chat-funktionen fra.
»Det synes jeg er lidt af en fejl. Hvis man slår chat-funktionen fra, så skal Facebook jo slet ikke vise noget om hvornår man sidst var online.«
Søren Louv-Jansen gætter på, at den primære grund til, at Facebook ønsker hans projekt fjernet fra nettet er, at projektet sætter fokus på, hvor meget data om vores adfærd, den amerikanske virksomhed faktisk har adgang til.
»Det her er jo bare toppen af isbjerget, hvad jeg lige har kunnet scrape mig frem til.«
Det har ikke umiddelbart været muligt for Version2 at få en kommentar fra Facebook.
Blotlagde politikeres cpr-numre
Hvis navnet Søren Louv-Jansen virker bekendt, så er det måske fordi, han tidligere har gjort sig bemærket i forbindelse med kreativ anvendelse af offentligt tilgængelige data.
I 2012, da han var studerende på ITU, påviste han sammen med en medstuderende, hvordan det var muligt at gætte sig til folks cpr-numre via grænseflader hos teleselskaberne. Det udviklede sig til en hjemmeside med et såkaldt cpr-lotteri, hvor det var muligt at gætte sig frem til folketingspolitikeres og ministres cpr-numre.
Forløbet resulterede i, at Søren Louv-Jansen blev idømt en bødestraf på 3.500 i 2014. Strafferammen var op til 10.000 kroner, men Københavns Byret fandt det som en formildende omstændighed, at formålet med cpr-lotteriet havde været at påpege et sikkerhedsproblem. Sidenhen har teleselskaberne ændret praksis, så det ikke er muligt - ad den vej - at gætte folks cpr-numre.
Søren Louv-Jansen har lagt en video på Youtube, der viser GitHub-projektet i aktion.

...men det er dyrt at lave god journalistik. Derfor beder vi dig overveje at tegne abonnement på Version2.
Digitaliseringen buldrer derudaf, og it-folkene tegner fremtidens Danmark. Derfor er det vigtigere end nogensinde med et kvalificeret bud på, hvordan it bedst kan være med til at udvikle det danske samfund og erhvervsliv.
Og der har aldrig været mere akut brug for en kritisk vagthund, der råber op, når der tages forkerte it-beslutninger.
Den rolle har Version2 indtaget siden 2006 - og det bliver vi ved med.