Kendt sikkerhedsmand frigiver 1,4 mia. lækkede dataposter i analyseøjemed

En masse poster fra sikkerhedssitet 'Have I been pwned' er blevet frigivet, så folk kan analysere på datalæk.

Sikkerhedsmanden Troy Hunt har frigivet en hel masse data-læk-data fra sitet 'Have I been pwned', som han selv står bag.

Det fortæller Hunt nærmere om i et blogindlæg.

'Have I been pwned' fører regnskab med diverse datalæk, og det er gennem tiden blevet til en betragtelig database med informationer om læk. Det er disse data, som Troy Hunt nu åbner op for. Dog med et par men'er.

»Jeg får mange forespørgsler fra folk om data fra 'Have I been pwned' (HIBP), som de kan analysere. Naturligvis er der en del folk, som er ude på ballade, der efterspørger data, men tilsvarende er der også mange andre, som bare vil køre statistik. Under alle omstændigheder har svaret altid været 'nej, jeg kommer ikke til at videredistribuere data til dig'. Faktisk skete forespørgslerne så ofte, at jeg sågar skrev blogindlægget 'Nej, jeg kan ikke dele datalæk med dig',« fortæller Hunt og fortsætter:

»Men i anledning af HIBP's tredje fødselsdagsfejring så VIL jeg dele data med dig - en hel del. Faktisk så åbner jeg for næsten al data i HIPB med nogle få, vigtige forbehold,« fortæller Troy Hunt og går videre til forbeholdene.

  1. Alle personidentificerbare informationer er blevet fjernet

  2. Alle informationer om domæner, som de enkelte konti er på, er blevet fjernet.

  3. Alle følsomme datalæk er blevet fjernet. Følsomme datalæk er blandt andet fra porno-sites, fremgår det af en definition på HIBP.

Troy Hunt begrunder forbeholdene som følger:

»Lige så meget, som jeg gerne vil levere data til analyse, så ønsker jeg ikke at udsætte nogen for yderligere risici, hvilket er årsagen til, at de personidentificerbare data er borte.«

Et eksempel

Men hvad man kan man så se egentlig? Jo, eksempelvis fremgår det af datasættet, at 20 unikke mail-adresser optræder i forbindelse med fem datalæk fra Adobe, Aipai, CivilOnline, NetEase og NexusMods. Posten ser således ud i det frigivne datasæt:

Adobe;Aipai;CivilOnline;NetEase;NexusMods 20

Datasættet kan hentes via en Torrent, som Troy Hunt linker i blogindlægget.

I alt danner 1.431.112.732 poster grundlag for datasættet, der i aggregeret form fylder 135MB.

Aggregeret vil her sige, at der ikke optræder en selvstændig - eksempelvis - LinkedIn post for hver lækket konto. I stedet står der bare 'LinkedIn 105645374', forklarer Hunt.

Det er alle mail-adresser i HIPB per 6. december 2016 eksklusive de mailadresser, som udelukkende optræder i datalæk, Hunt har kategoriseret som værende følsomme.

I debatten under Troy Hunts blogindlæg bringer flere brugere eksempler på, hvordan dataene kan visualiseres.

Tips og korrekturforslag til denne historie sendes til tip@version2.dk
Følg forløbet
Kommentarer (0)
sortSortér kommentarer
  • Ældste først
  • Nyeste først
  • Bedste først
Log ind eller Opret konto for at kommentere