Kære webudvikler: Vær med til at sænke overvågningen
Vi er igang med at udvikle nyt website. I PROSA er vi meget opmærksomme på overvågningen, og vil gerne beskytte vore medlemmer så meget som vi kan - og i hvert fald ikke aktivt støtte overvågningen. Derfor har vi et mål om, at bruger man vores nye webside, så skal ens browser kun tale med vores webserver og ikke med 100+ tracking sites.
Som webudvikler har man et medansvar for overvågningen af borgerne. Det bedst kendte eksempel er nok reklamestalking, hvor en reklame forfølger dig på tværs af websites. Her er det tydeligt, at borgeren bliver tracket. Men der er mange andre tilfælde, der ikke er helt så tydelige.
Facebooks Like-knap hentes normalt fra Facebooks servere, så alene det, at du besøger en side med en 'Like'-knap fortæller Facebook, at du har besøgt siden. Er du ikke logget ind i Facebook, holder Facebook styr på dig, så hvis du på et senere tidspunkt logger ind, ved Facebook præcis hvilken facebookbruger, der er tale om.
Det samme gælder for rigtigt mange dele-knapper: Google+'s +1, Twitter, og Linked-in.
Lidt mindre tydeligt er tracking til analyse. Her ser borgeren ikke overvågningen. Det er f.eks. Chartbeat, som bruges på Politiken. Her bliver Chartbeat informeret om, at du har besøgt en given artikel på Politiken.dk, men Chartbeat bruges også på Avisen.dk, så hvor Politiken alene kan følge, hvilke artikler du læser på politiken.dk, så kan Chartbeat også se, hvilke artikler du læser på Avisen.dk.
Det giver Chartbeat en viden om dig, som hverken Politiken eller Avisen har.
Flere og flere benytter Google Analytics. Det fungerer godt, og det er gratis - i hvert fald for webside-ejeren. Prisen betales naturligvis af nogle andre, og i dette tilfælde er det brugernes privatlivskapital, der betales med.
Ligesom med Chartbeat bliver borgeren ikke opmærksom på, at hvert klik bliver sendt til Google, og hvis man er logget ind i een af Googles services (f.eks. GMail eller Youtube), så kobles disse klik til profilen - ligesom Facebooks Like-knap, og det kan så igen bruges af Googles annoncenetværk (hvor Doubleclick nok er de mest kendte).
Benytter du login via Facebook, Google eller ligende, så bliver borgernes login på dit site naturligvis også koblet til borgernes profil hos Google/Facebook.
Benytter du indlejrede elementer, så som kort fra Google Maps, videoer fra Youtube, de seneste tweets og facebook-opslag, Googles reCAPTCHA, Disqus-debat eller Google Site Search, så bliver leverandøren af disse elementer også informeret om borgerens besøg.
En URL-shortener er jo dejlig, hvis man skal videregive en tosselang URL på tryk, men her kan leverandøren naturligvis også tracke hvilke besøgende, der kommer ind den vej.
Men også helt banale ting som fonte og JavaScript-libraries kan være med til at tracke brugeren. fonts.googleapis.com er velkendt for de fleste webudviklere. Benytter man fonte herfra, så bliver Google informeret om borgerens besøg. Det samme gælder, hvis man bruger JavaScript-libraries f.eks. fra https://ajax.googleapis.com/ajax/libs/jquery/3.1.0/jquery.min.js.
Hvis man benytter CDN (Content Delivery Network) ala CloudFlare, Akamai eller Amazon Cloudfront, så sender du dine brugere via 3-parts servere. Disse skal du naturligvis have tillid til ikke profilerer dine brugere - og hvis CDN'et er gratis at bruge, så kan det tyde på, at forretningmodellen er svarende til Google Analytics: Prisen betales med brugerens privatlivskapital. Du kan øge tilliden ved at bede CDN'et underskrive en databehandleraftale.
Derudover bør man være opmærksom på historien med Lavabit. Lavabit var Snowdens mail-leverandør og blev via et National Security Letter blev Lavabit tvunget til at udlevere krypteringsnøgler.
Grunden til, at vi kender historien er, at Lavabit nægtede; men det kan vi ikke forvente at alle andre leverandører med store aktiviteter i USA vil gøre. Hvis I er nødt til at benytte CDN, så sørg i hvert fald for, at CDN'et holder til i EU (og derfor er underlagt EU's persondataforordning) og at de ikke har store aktiviteter i USA (så de undgår at komme i samme situation som Lavabit).
Løsninger
Løsningen er generelt at lave sin egen kopi og lægge den på ens egen webserver. Det gælder for fontene og JavaScript-libraries; fontene er godt nok lidt bøvlede fordi de skal konverteres til forskellige formater, men det kan lade sig gøre.
Man kan lave sin egen kopi af dele-knapperne, så information ikke lækkes til virksomhederne før der klikkes, men det er bl.a. Facebook selvfølgelig ret kede af.
Indlejrede elementer kan også kræve et klik for at blive aktive, eller man kan hoste dem selv (f.eks. kan de fleste moderne webbrowsere idag afspille .webm-video) eller man kan benytte services, som ikke har ry for at tracke (f.eks. Open Street Map).
At hoste den selv gælder også for URL-shorteneren og søgemaskinen, hvor der findes plug-ins til de fleste CMS'er.
I stedet for Google Analytics kan man bruge noget, som man selv hoster, f.eks. Piwik.
Som login kan man tilbyde OpenID. Så kan borgerne selv vælge, hvilken OpenID-udbyder, som de har tillid til.
Som reklamer kan man enten hoste det selv eller bruge reklamenetværk som ikke tracker. Det sidste kræver selvfølgelig tillid til, at de ikke tracker.
For at forsvare mod aflytning af netværket bør du benytte https alle steder.
Hvis det ikke er muligt at undgå trackingen, så gør det i det mindste klart for borgeren - som minimum ved i beskrivelsen af cookies at nævne præcis hvilke 3. parter, der er tale om, og ikke bare smyge sig udenom ved at skrive "vi deler med 3. part, men gider i øvrigt ikke fortælle dig hvem".
Test det
Disconnect.me, Privacy Badger og Ghostery er gode til at vise, om du har fået det hele med.
CDNPlanet har et værktøj, der også kikker på CDN'er.
Har jeg glemt nogen?
Jeg har identificeret disse trackingmetoder, som man som webudvikler skal være opmærksom på:
- Dele og like-knapper (f.eks. Facebook Like, Facebook Share, Google+'s +1, Twitter 'tweet', Linked-in 'share')
- Reklamenetværk
- Indlejret eksternt indhold eller funtionalitet (f.eks. Google Maps eller Youtube)
- Eksterne statistiksystemer (f.eks. Google Analytics eller Chartbeat)
- Login via eksterne parter (f.eks. Facebook Connect)
- Eksterne URL-shorteners
- Eksterne fonte
- Eksterne JavaScript-libraries.
- CDN
Har jeg glemt nogen? Skriv også gerne en kommentar, hvis du har en løsning, som jeg ikke har dækket.

...men det er dyrt at lave god journalistik. Derfor beder vi dig overveje at tegne abonnement på Version2.
Digitaliseringen buldrer derudaf, og it-folkene tegner fremtidens Danmark. Derfor er det vigtigere end nogensinde med et kvalificeret bud på, hvordan it bedst kan være med til at udvikle det danske samfund og erhvervsliv.
Og der har aldrig været mere akut brug for en kritisk vagthund, der råber op, når der tages forkerte it-beslutninger.
Den rolle har Version2 indtaget siden 2006 - og det bliver vi ved med.