Berlingske: Google er skyld i læk af personoplysninger

Google burde ikke have indekseret en liste med kontaktoplysninger på Berlingske Nyhedsmagasins nyhedsbrevsmodtagere, forsvarer Berlingske sig. Vrøvl, fejlen er Berlingskes, siger søgemaskineekspert

En liste med navn, email, adresse og telefonnummer på flere hundrede abonnenter af Berlingske Nyhedsmagasins nyhedsbrev har ind til i dag kunnet findes via Google.

Berlingske Media svarer nu på, hvordan det har kunnet lade sig gøre.

»Der er tale om en transfer fil, vi har brugt for at overføre data mellem to systemer, som har ligget på en server, vi blandt andet bruger til at sende vores nyhedsbreve ud fra,« siger Stefan Rikard Brieghel, kampagnechef i Berlingske Media til Version2.

Han benægter, at lækken af oplysningerne skyldes en fejl fra Berlingskes eller leverandøren Adnuvos side, men angiver, at det derimod er Google, som har indekseret filer, de ikke burde.

»Vi har ikke gjort listen offentlig tilgængelig. Vi har beskrevet i robot.txt-filen, at den ikke skal indekseres af søgemaskiner,« forklarer Stefan Rikard Brieghel og henviser til en mail til Version2, hvori det hedder:

»Google, som nu har fjernet linket fra deres cache, har bekræftet overfor Berlingskes leverandør, at den pågældende server var korrekt opsat og beskyttet, så Googles søgerobotter ikke burde indeksere den og dermed gøre filen offentlig tilgængelig.«

Den udlægning er søgemaskineeksperten Mikkel deMib Svendsen stærkt uenig i.

»Hvis Berlingske har lagt noget på en offentligt tilgængelig server, jamen så ER det offentligt tilgængeligt. Det er dem selv og ikke Google, der gør det tilgængeligt. For hvis Google kan finde listen, så kan du og jeg også,« siger Mikkel deMib Svendsen.

Man kan ifølge Mikkel deMib Svendsen godt kommunikere til Google og andre søgemaskinger via robot.txt eller meta-robot, at de ikke skal indeksere bestemt materiale, men hvis andre brugere har fundet materialet og linket til det ? eller hvis Berlingske selv på den ene eller anden måde har linket til listen ? så er der ingen garanti for, at den ikke dukker op i søgeresultaterne.

Vil ikke ændre proceduren

Stefan Rikard Brieghel forklarer, at man nu har fjernet filen fra serveren, samt at Google har slettet oplysningerne i deres cache, men at Berlingske ikke har tænkt sig at lave om på proceduren. De vil stadig forlade sig på, at en beskrivelse i robot.txt-filen er tilstrækkelig.

»Vi har kørt efter foreskrifterne. Vi følger de standarder og den lovgivning, der er på området. At Google indekserer noget, vi siger de ikke skal, er ikke vores fejl,« siger han.

Endnu en gang er søgemaskineeksperten Mikkel deMib Svendsen uening.

»Helt grundlæggende skal den slags data ikke ligge et sted, hvor alle kan finde det. Og hvis man endelig vil rode sig ud i den slags, må man i det mindste beskytte dem med password eller kryptering. Google hacker altså ikke andre virksomheders websites,« siger Mikkel deMib Svendsen.

Tips og korrekturforslag til denne historie sendes til tip@version2.dk
Kommentarer (20)
sortSortér kommentarer
  • Ældste først
  • Nyeste først
  • Bedste først
Oscar Gensmann

»Vi har kørt efter foreskrifterne. Vi følger de standarder og den lovgivning, der er på området. At Google indekserer noget, vi siger de ikke skal, er ikke vores fejl,« siger han.

Det har nu så længe jeg husker, og haft noget med den slags at gøre, altid været standarden, i de fleste udviklerkredse, at man lægger adgangsbeskyttelse på tilgangen til følsom data. Også selvom det skal flyttes mellem to systemer via en ellers offentlig webserver.

Jeg tror heller ikke at datatilsynet vil være meget anderledes indstillet i den tolkning i forhold til offentliggørelse af følsom data.

Persondataloven siger:

§41
Stk. 3. Den dataansvarlige skal træffe de fornødne tekniske og organisatoriske sikkerhedsforanstaltninger mod, at oplysninger hændeligt eller ulovligt tilintetgøres, fortabes eller forringes, samt mod, at de kommer til uvedkommendes kendskab, misbruges eller i øvrigt behandles i strid med loven. Tilsvarende gælder for databehandlere.

At lave sikkerhed udelukkende ved at håbe på at ingen gætter addressen (Security through obscurity) til filen kan i vore dage ikke betragtes som "fornøden teknisk sikkerhedsforanstaltning" for så vigtig data som e-mail-adresser, som der om noget er personhenførbare nu om dage takket være facebook og lignende tjenester, der ofte er bundet op på brugerens unikke og personlige e-mail-adresse.

Det virker som en fjollet undskyldning fra Berlingske side fordi de ikke vil indrømme at de har lavet en bummert og forsøger at skubbe den videre eftersom der i det nævnte tilfælde rent faktisk er en mulighed for at give Google skylden i og med at de har lavet en indekseringsfejl og så håber man at offentligheden spiser den.

Det er jo en ganske enkel procedurefejl og sikker menneskelig fordi det har skulle gå stærkt eller lignende og så er filen måske ikke blevet slettet igen pga glemsomhed.
Så må man sige undskyld, rette fejlen og komme videre. At skyde skylden på en søgemaskine der tilfældig kom forbi virker ansvarsfraskrivende og lidt skidt for hvad der burde være en professionel og ordentlig virksomhed som Berlingske.

Errare humanum est, sed in perseverare diabolicum.

Jens Fallesen

Det kunne faktisk være interessant at vide, hvad Datatilsynet sagde til denne sag. Måske Version2 skulle prøve at tage kontakt til dem?

Ja, egentlig burde en af de ramte personer prøve at anmelde Berlingske til Datatilsynet. En ting er at sløse med tingene, men direkte at melde ud, at man vil fortsætte med at overtræde Persondataloven, er da at stramme den …

Jesper Utoft

Hvis man har en fil som ikke skal indekseres af Google så sørger man da i det mindste for ikke at linke til den på offentlige websteder google allerede har indekseret. At man skriver den i robot.txt er en fin tanke men det giver ligepludselig andre systemer mulighed for at finde den. Helt ærligt tror de google er det eneste firma der læser i robot.txt filen. Hvis jeg var kriminel/spammer ville jeg da helt sikkert være mest interreseret i det robot.txt filen siger der ikke skal indekseres.

Den system administrator er fejlen ikke Google. Hvis de søger erstating må det da være for personen der har lavet systemet.

Martin Zacho

Hvordan kan Google indeksere en fil, hvis der ikke er et link til den pågældende fil ?

Almindeligvis ville en default index.html jo forhindre at et directory kunne ses via en browser eller søgemaskine og det har enhver ansvarlig webredaktør vil på sit site ?!

Martin.

Frithiof Andreas Jensen

Google kan "se" alt hvad web-serveren kan se - hvis http://www.version2.dk/artikel nu tilfældigvis peger på en folder som web-serveren kan læse så kan Google vandre igennem hele fil-træet nedenunder.

Relative paths virker også hvis serveren er tilpas miskonfigureret.

Hvis man ikke vil have noget vist frem så sørger man for at web-serveren ikke har adgang til det (og hvis man tror at "robots.txt" er en sikkerhedsfaktor så er man en idiot)!

Lidt om Google Hacking:

http://johnny.ihackstuff.com/ghdb.php
http://it.toolbox.com/blogs/managing-infosec/google-hacking-master-list-...

Hans-Kristian Bjerregaard

Det er jo direkte skandaløst at berlingske ikke har styr på indholdet på deres servere. Jeg syntes ikke man skal kaste skylden på den enkelte udvikler for der er noget helt galt med selve strukturen og ledelsen af en it-afdeling når sådan noget forekommer som mere end en engangsfejl.

Desvære syntes jeg tit man ser de mellemstore virksomheder have denne sløsede tilgang til deres interne struktur hvor de implementerer en masse forskellige systemer og slamkoder dem sammen fordi det skal gå stærk istedet for at bruge tiden på at udvikle en ordentlig løsning!

Anders Reinhardt Hansen

Det tyder på at man har nogle offentligt tilgængelige servere, hvis struktur ikke er generaliseret og/eller at disses indhold ikke er 100% kendt af IT-afdelingen. Det kan aldrig være Googles skyld. Hvis du har noget data der ikke skal deles med omverdenen skal det aldrig ligge på en server uden i det mindste adgangskontrol.

Martin Zacho

Google kan "se" alt hvad web-serveren kan se - hvis http://www.version2.dk/artikel nu tilfældigvis peger på en folder som web-serveren kan læse så kan Google vandre igennem hele fil-træet nedenunder.

Det er jo netop derfor man skal forhindre at filtræet kan vises. En nem må er blot at placere en tom index.html i den pågældende folder.

Så kan man sagtens skrive:
'Disallow: /semiprivatstuff/'

i sin robots.txt - ingen (ikke engang Google) kan så se hvilke filer der er i den pågældende mappe.
Men selvfølgelig kan man gætte sig til filnavne ala 'password.txt' ;-)

Martin

Peter Makholm Blogger

Jeg håber meget på at vi alle sammen er klar over det, men lige for en sikkerhedsskyld:

At bruge en robots.txt må ALDRIG anses for en et sikkerhedsværktøj. Det har ingen teknisk virkning og er kun en anmodnin gom ikke at crawle bestemte sider og det er derfor kun ikke-onde crawlere der må antages at efterfølge anmodningen.

Er eksempel på en ond webcrawler der ikke følger robots.txt er det danske statslige webarkiv netarkivet.dk. Denne crawler har derfor muligvis allerede listen.

At lave en robots.txt indenholdende 'Disallow: /semiprivatstuff/' er nærmere en sikkerhedsrisiko da det fortæller alverden hvor man lægger private ting.

Peter Makholm Blogger

Du burde med persondataloven i hånden kunne henvende dig til Berlingske og spørge dem om du var på denne liste og i så fald om en log over hvem de har givet listen til.

Kunne faktisk være sjovt, men jeg er ret sikker på at jeg ikke selv er på listen, så jeg har vist ingen 'retslig interesse' eller hvad det nu hedder.

Anonym

Jeg er ganske enig.

Google går IKKE ind og indekserer filer, som ikke er offenligt tilgængelige. Det ville svare til, at deres bot forsøgte at hacke (cracke) sig ind, og det er selvfølgelig ikke lovligt heller - hvis det var tilfældet, ville Berlingske vel lægge sag an? Men det har de så gjort, for det må jo være det, de mener er sket?

Det tyder mere på, der er folk ansat hos Berlingske, som reelt ikke aner en brik om, hvad de laver. Og hvad hulen er det for en elendig "undskyldning"?

Fuldstændigt enig med deMib iøvrigt. Der er ikke noget at komme efter hos Google.

Berlingske har mistet al respekt fra min side.

Log ind eller Opret konto for at kommentere