Bots og Internet Archive fixer millioner af døde links i Wikipedia

Illustration: Bigstock
En bot har drejet ni millioner links fra 404 til Internet Archives Wayback Machine.

Det store webs mange links, der får det hele til at spille, har det med at ruste over tid. Virksomheder, regeringer, uddannelsesinstitutioner, enkeltpersoner og organisationer opsætter og nedlægger websites hele tiden.

For online-leksikonet Wikipedia har det betydet, at ni millioner links pegede på sider, der ikke længere fandtes.

Wikipedia har nu med hjælp fra frivillige fra Internet Archive været i stand til at genoprette millioner af brudte links. Det skriver Techcrunch.

Internet Archive tager en kopi af så mange websites som muligt, for at opbygge et arkiv af webbets sider. Dets Wayback Machine-arkiv indeholder 338 milliarder websider, som går helt tilbage til de tidligste dage på webbet.

For at løse problemet med de knækkede links, byggede en Wikipedia-deltager, Maximilian Doerr, et program med navnet Iabot, Internet Archive bot.

Først identificerede Iabot brudte links, de sider, der returnerede en 404-statuskode, der som bekendt betyder 'siden kan ikke findes'. Når programmet fandt et knækket link, søgte den på internetarkivet for den oprindelige side, og hvis en kopi fandtes, linkede den til kopien i arkivet.

I løbet af en treårsperiode hjalp denne software med at reparere seks millioner links på Wikipedia. Frivillige fik yderligere tre millioner links gendannet, ved manuelt at linke til den rigtige side i arkivet.

Tips og korrekturforslag til denne historie sendes til tip@version2.dk
Følg forløbet
Kommentarer (2)
sortSortér kommentarer
  • Ældste først
  • Nyeste først
  • Bedste først
Log ind eller Opret konto for at kommentere