Metadata er vigtige

Det er længe siden jeg har set en bedre illustration af hvorfor metadata er utroligt vigtige i privatlivssamenhæng.

Denne artikel fra Slate bliver formodentlig standard-pensum på jurastudiet fremover.

phk

Kommentarer (10)
sortSortér kommentarer
  • Ældste først
  • Nyeste først
  • Bedste først
#2 Søren Koch

jeg er ret sikker på at PHK bare vil illustrere hvor meget man kan få ud af metadata.

lidt det samme som trafic-analysis af krypteret kommunikation. man ved ikke hvad de siger, men man kan ofte finde ud af hvem der snakker med hvem og ud fra det kan man ofte få ret mange brugbare informationer.

  • 8
  • 0
#3 Bjarne Nielsen

Jeg er ret sikker på at PHK bare vil illustrere hvor meget man kan få ud af metadata.

Really? PHK er en af de personer, som formulerer sig på en måde, som gør det vanskeligt for mig at gætte, hvad han egentlig mener - og det viser historikken at mange andre også har. Du kan være heldig at have ret i dette tilfælde, men jeg ville ikke satse på det.

Til gengæld så er jeg rimeligt overbevist om, at de som har lavet dette - undskyld mig - hjælpeløse forsøg på anonymisering, selv har ment, at de har gjort et godt stykke arbejde. Og det er desværre meget udbredt, at forsøg på anonymisering i praksis er hjælpeløst utilstrækkelige, og tillægges alt for stor betydning - og det er derfor bekymrende, hvor stor den kattelem har fået lov til at blive.

  • 9
  • 2
#5 Torben Mogensen Blogger

Det er en håbløst gammeldags metode til at fjerne ord i en tekst. Udover det tåbelige i at de forekommer i en alfabetiseret liste med stedreferencer (hvor nogle af referencerne endda viser ordet uden overstregning), så kan længden af det overstregne ord give en del information, specielt når der, som i den viste tekst, bruges fast tegnbredde. I disse digitale tider kan man nemt erstatte de fjernede ord med sorte bjælker med ensartet bredde, genombryde teksten, og udregne en ny referenceliste ud fra den redigerede tekst.

Det kræver selvfølgelig, at man stoler på den instans, der laver disse redigeringer, men det skal man alligevel med den gammeldags metode -- der er intet, der hindrer, at de laver et falsk dokument, som de bagefter overstreger ord i.

  • 0
  • 2
#6 Poul-Henning Kamp Blogger

PHK er en af de personer, som formulerer sig på en måde, som gør det vanskeligt for mig at gætte, hvad han egentlig mener

Denne blogs primære formål er at få folk til at tænke og hvor muligt at more sig lidt. Hvad min personlige holdning er, er ikke altid relevant, og f.eks ikke i dette tilfælde.

Når jeg f.eks bringer denne nyhed til torvs er det fordi den rammer ned i et antal interessante emner og jeg antog at det var så indlysende at jeg ikke mente yderligere kommentar ville tilføje noget til sagen.

Men hvis jeg skal pinde det ud:

Her har vi en retssag, hvor nogle af de mest berømte personer, nogle af de personer der bruger flest penge på at beskytte deres privatliv, herunder anvendelsen af så mange dyre advokater som nødvendigt, bliver stillet nøgne i medierne, fordi ...

Ja, hvorfor ?

Inkompetente Advokater ?

Næppe!

Advokaterne har i denne sag kæmpet med næb og kløer for at dette dokument skulle forblive "under seal", men det slagsmål tabte de men de opnåede tilladelse til "minimal redactions".

Dokumenter af denne type har formkrav, herunder at de skal indeholde et index hvis de er over en triviel længde.

Hvor gerne de end ville, kunne advokaterne ikke få lov til at fjerne hele indexet.

Et index er 100% klassiske metadata og dermed er vi midt i hele privatlivssuppedasen.

Den direkte linie til Se&Hør/IBM-snage-i-kreditkort-transaktioner skandalen burde være unødvendig at trække.

Og ja, jeg kan absolut garantere dig at Slate's artikel giver genlyd i branchen for "Dyr Personlig Advokat For Rige Personer" i USA, og der vil blive spildt oceaner af tid på at finde på juridiske strategier så man ikke havner i den suppedas nogensinde.

  • 11
  • 0
#7 Poul-Henning Kamp Blogger
  • 11
  • 0
#9 Poul-Henning Kamp Blogger

O.k., men hvis man sletter et ord fra index, så burde man i det mindste også slette de side/linjenumre, der er forbundet til ordet.

Helt enig.

Vi ved ikke om de har spurgt om lov til netop det, vi ved kun at de bad om lov til meget mere omfattende "reactions" og tabte den diskussion.

Modparten har også meget skarpe advokater og jeg kan sagtens se dem argumentere for at "navnene og kun navnene på flg personer ..." må "redactes"

Uden at have hørt diskussionen (der i stort omfang foregik i "chambers") ved vi ikke hvor for det endte sådan.

  • 3
  • 0
#10 Bjarne Nielsen

O.k., men hvis man sletter et ord fra index, så burde man i det mindste også slette de side/linjenumre, der er forbundet til ordet.

Bedre, men sandsynligvis stadig utilstrækkeligt.

Afhængigt af, hvor meget blæk man bruger, så vil der være mere plads til at gemme sig i, men man skal ikke spillet meget sudoku for at forstå, at selv store huller kan udfyldes, hvis man starter med nogle rimelige gæt fra den nemme ende af.

Og en af de klassiske fejl er, at antage at man ikke kan bringe anden viden i spil, end det som er forsøgt anonymiseret. Det med anden viden er der faktisk også eksempel på i den linkede artikel.

Anonymisering er sværere end man tror, også selvom man tager højde for, at det er sværere end man tror. Tilliden til, hvad anonymisering kan, er i almindelighed malplaceret og stærkt overdrevet.

Man kan håbe, at det her var en grundig lærestreg, men mit gæt er, at man næste gang laver en lille opstramning, som f.eks. den her foreslåede, og så tror man at den hellige grav er velforvaret.

  • 6
  • 0
Log ind eller Opret konto for at kommentere