Opfinderen af de irriterende CAPTCHAs er på nye eventyr

Er der noget mere fagligt tilfredsstillende end at skabe en elegant løsning på et væsentligt problem? Og så eksekvere løsningen overbevisende? Ikke for mig.

Luis von Ahn er derfor en af mine helte. Han har om nogen fundet elegante og velfungerende løsninger på udredte problemer – oven i købet ved at udnytte menneskets og computerens stærke sider til at supplere hinanden. Og med en eminent eksekvering oven i hatten.

CAPTCHA

Ahn er manden bag de grafiske CAPTCHA som alle kender og de fleste hader. CAPTCHA står for "Completely Automated Public Turing test to tell Computers and Humans Apart". Hvis du har levet i yderste afsondrethed og mener aldrig at have set en sådan, så er der et udvalg her med eksempler fra forskellige tjenester:

Illustration: Privatfoto

Eksempler på CAPTCHAs. Ja, du har set en før.

Dagligt løses 200 millioner CAPTCHA's, svarende til et forbrug på 150.000 arbejdstimer, hvilket egentligt er spil af menneskehedens hjernekraft.

reCAPTCHA

Ahn tog derfor for nogle år siden skridtet videre med reCAPTCHA som er en meget elegant løsning på to problemer på samme tid:

  • Hvordan sikre man at de brugere, som forsøger at få adgang til et site, nu også er mennesker og ikke fx spam-robotter?
  • Hvordan får vi digitaliseret de mange gamle bøger, hvor op imod 10 % af ordene i dag ikke kan afkodes maskinelt?

CAPTCHA løste det første problem men uden egentligt at skabe værdi i sig selv. reCAPTCHA er derimod genial ved at løse begge problemer på samme tid og at gøre det på en elegant måde gennem massiv crowdsouring: Den opdeler digitaliseringen af bøger i et væld af småopgaver af 10 sekunders indsats og ved at bruge computere til at distribuere dem ud til millioner af mennesker som hver især er motiverede for at løse sin del af opgaven. 750 millioner forskellige personer (ja, det siger han selv) har i dag hjulpet med at digitalisere bøger ved at løse en eller flere reCAPTCHA-opgaver.

Eksempel på en reCAPTCHA med forklaring på hvordan digitalisering af tekster hjælpes på vej

Hvis formålet og løsningens elegance i kombination med eksekveringen ikke er nok til at give Ahn en nobelpris eller lignende, så er hans nuværende projekt, Duolingo, i hvert fald en kandidat.

Duolingo - det nye eventyr

Ahn har stillet sin forskergruppe følgende opgave: Hvordan får man 100 mio. mennesker til at oversætte nettets indhold til alle hovedsprogene - gratis?

Baggrunden for opgaven er, at det meste af nettet ikke er tilgængeligt for store dele af verdenens befolkning, fordi indholdet ikke oversat til sprog som de forstår. Automatiske oversættelse af god nok kvalitet er endnu måske 10 år ude i fremtiden. Men med nok folk til opgaven, ville den engelske udgave af Wikipedia lige under fire millioner artikler vil kunne oversættes til fx spansk på 5 uger med 100.000 brugere og på blot 80 timer med 1 million brugere.

Se hvordan han griber den opgave an (10:00 minutter inde i præsentationen)

Kommentarer (9)
sortSortér kommentarer
  • Ældste først
  • Nyeste først
  • Bedste først
Mads Grøftehauge

Duolingo er en god ide, men der er sgu en verden til forskel på Ahns eksempel på systemets evner, den simple sætning med Mubarak og kamelen, og så eksemplet på, hvad man gerne vil opnå, nemlig de meget tekniske og specialiserede tekster på Wikipedia. Præsentationsvideoen på duolingo.com (som i øvrigt kun findes på engelsk) er endnu værre med sit 'Donde esta la biblioteca'...
Så Duolingo ligner et fint supplement til maskinoversættelse af enkle, statiske tekster. Men til nyt indhold, med nye koncepter og specialiseret viden samt kvalitetskrav som fx konsistens fra én sætning til den næste, bliver jeg og andre oversættere ikke arbejdsløse foreløbig.

  • 0
  • 1
Peter Nørregaard Blogger

Oversættere bliver nok ikke arbejdsløse lige med det samme. Men der er jo også sgu en verden til forskel på at betale 20 cent per oversat ord og så gratis - jeg tror at, et vist kvalitetstab er acceptabelt i rigtigt mange tilfælde.

At der skal være konsistens fra en sætning til en anden gennem en artikel bliver nok på sigt en øvelse i Doulingo :-)

  • 0
  • 0
Jan Gundtofte-Bruun

Du bør aldrig give et link og bede læseren om at "spole frem" eller "scrolle ned".

For YouTube er det ganske simpelt! I stedet for:
http://www.youtube.com/watch?v=-Ht4qiDRZE8
skriver du:
http://www.youtube.com/watch?v=-Ht4qiDRZE8&t=10m1s
eller:
http://www.youtube.com/watch?v=-Ht4qiDRZE8&t=601
for at automatisk spole så mange minutter og sekunder frem.

:-)

  • 0
  • 0
Peter Nørregaard Blogger

Tak for tippet. Jeg fandt ud af at det måtte være mig, du mente men der er nok flere journalister, der gerne vil have sig frabedt at blive slået i hartkorn med en simpel blogger.

Afprøvede dit link men det overlever ikke den fortolkning som CMS'et her lgger ned over video-links, så jeg må desværre lade den være som det er. Ellers et smart tip!

  • 0
  • 0
Log ind eller Opret konto for at kommentere