Google overdriver influenzavarsler for tredje år i træk

Big data gone bad? En undersøgelse viser, at Google forudser langt mere influenza, end der rent faktisk registreres.

Google maler fanden på væggen, når virksomheden skal forudsige influenzaudbrud med sit dertil indrettede produkt – Google Flu Trends. Tjenesten har siden 2008 analyseret Google-søgninger på symptomer og andet, der kan vedrøre influenza, og brugt resultaterne til at forudse influenzaudbrud i forskellige dele af verden.

Men ifølge Newscientist er der altså en klar tendens til at overdrive, der har stået på i indtil videre tre år. I 2012/2013-sæsonen forudså Google Flu Trends dobbelt så mange influenzarelaterede lægebesøg, som myndighederne faktisk endte med at registrere.

Det er professor David Lazer fra Northeastern University, der har undersøgt pålideligheden af Googles influenzaforudsigelser, og det undrer ham, at tjenestens resultater rammer så skævt.

»Det er mig en gåde, for det ville ikke have krævet særlig meget arbejde at gøre tjenesten meget bedre,« udtaler David Lazer og tilføjer, at en sammenkøring af data fra Google og data fra de amerikanske sundhedsmyndigheder giver et langt mere retvisende billede.

Privacy-jurist Neil Richards fra Washington University understreger, at de overdrevne forudsigelser eksemplificerer, hvor vigtigt det er at være opmærksom på den magt, som store datamængder har givet teknologivirksomhederne.

»Vi har teknologivirksomheder, der konkurrerer med staten, og som har langt større indflydelse på vores dagligdag. I takt med, at de har fået endnu mere magt, er det vigtigt at forstå deres funktioner og være opmærksom på deres fejl,« lyder det fra Neil Richards.

Tips og korrekturforslag til denne historie sendes til tip@version2.dk
Følg forløbet
Kommentarer (7)
sortSortér kommentarer
  • Ældste først
  • Nyeste først
  • Bedste først
Johnnie Hougaard Nielsen

Et eller andet sted så jeg noget med at værktøjet er baseret på big-data analyser af søgninger, således at de havde matchet søgekriterier med tidligere influenza-udbrud. I princippet en god metode, men med den svaghed at de ikke ved om de specifikke søgeord i mønstrene har noget med influenza at gøre. Der var nævnt at de havde været inde og fjerne søgeord, som i stedet var relateret til basketball (tror jeg), som har sæson i nogenlunde samme periode. Det lugter af at der kunne være mange andre skæve søgeord med i puljen.

  • 0
  • 0
Niklas Pedersen

Hvor mange mennesker Googler efter information om influenza, for derefter at gå ned og få den samme information af vide af lægen?

Jeg har personligt nok haft influenza de første 10 gange og jeg har ikke været hos lægen en eneste gang (ihvertfald hvor jeg har været gammel nok til at kunne huske det) af den årsag.

  • 1
  • 0
Johnnie Hougaard Nielsen

Hvor mange mennesker Googler efter information om influenza, for derefter at gå ned og få den samme information af vide af lægen?

Det er jo ikke det det handler om her. Tværtimod mere dem der søger på "vage" symptomer, når de har fået det skidt.

Selv om de ikke selv går til lægen, ville en vinterlig stigning i antal søgninger på ting som muskelømhed, hovedpine og feber være en kraftig antydning af at der kunne være en influenza-epidemi på vej. Den type søgninger kommer sjældent når folk har det fint.

Problemet er jo så at Google ikke rammer så godt hvad mængden af tilfælde angår.

  • 0
  • 0
Pelle Söderling

Personligt tager jeg heller aldrig til lægen ved influenza (hvad er det helt præcist lægen skal kunne gøre anyway?), men jeg kunne da sikkert godt finde på at google det for lige at se hvad netdoktor ville skrive angående ting der kunne dulme symptomerne lidt eller lign.

Så hvilken løsning der reelt giver det mest retvisende billede er ikke så sort på hvidt, Google kunne nemt ramme mere korrekt end de "officielle" tal eftersom disse typisk er baseret på henvendelser på apoteker, besøg hos lægen og lign. henvendelser hos det "offentlige system", som man må formodes er relavtiv få i forbindelse med noget så udbredt som inflenza hvor de fleste godt er klar over det skal være ret alvorligt førend der er nogen grund til at involvere en læge.

Når det er sagt så er Big Data analyse altså noget der kræver forståelse for de underliggende data at forstå og bruge fornuftigt. Der er et meget stort spring fra at vide at det handler om antal søgninger foretaget på en mængde search terms der har med inflenza at gøre, til at jumpe til at konkludere noget om omfanget af epidemier på denne baggrund. At foretage sådan en korrelation er ekstremt farligt fordi man nemt ophøjer det til en sandhed hvis man kan se det mindste pattern imellem dem og folk begynder nu at bruge de præsenterede resultater på denne måde.

Der er en masse spørgsmål man bør stille i den forbindelse for at kunne bruge tallene til noget som helst. Eksempelvis: Hvilke søgeord er der præcist tale om? Spænder de for bredt eller ikke bredt nok i forhold til ligepræcis "influenza"? Tælles søgninger på flere ord fra den samme bruger flere gange eller tælles der unikke brugere?

Uden at præcisere data-grundlaget er det her bare en sjov gimmick fra Google og man bør være meget varsom med at tro at det siger ret meget om udbredelsen af epidemier - man skal bare være opmærksom på at det gør de officielt registrerede tal sådanset heller ikke ...

  • 3
  • 0
Log ind eller Opret konto for at kommentere