Dansk machine learning-iværksætter: Google og Facebook skader vores evne til at opfinde nye ting

Når vi kun benytter os af tjenester som Google og Facebook til at finde information, bliver vi ikke klogere end gennemsnittet. Men den udfordring har avanceret sprogteknologi ifølge den tidligere danske produktchef på Siri potentialet til at løse.

På Facebook bliver jeg mødt af statusopdateringer, videoer og reklamer, der alle relaterer sig til min omgangskreds. Et par af mine venner synes godt om taxa-appen Uber, så nu ryger den også op i min feed. Når jeg søger på Google, er resultaterne automatisk tilpassede, så især dansk indhold kommer først. Og nogle gange må jeg tage mig selv i at tro, at Version2 er blevet Danmarks mest læste nyhedssite, fordi Google flere gange foreslår det i toppen af søgeresultaterne. Men så slår virkeligheden mig: Der er nok bare tale om personalisering. Google ved, hvor meget jeg søger efter mine egne artikler…

På den ene side er det jo herligt, at tjenesterne allerede ved, hvad jeg sandsynligvis leder efter, og gør det så nemt som muligt at finde det. Men den hastige udvikling med at personalisere indhold og sortere efter popularitet har en slagside ifølge den danske medstifter af machine learning-virksomheden Unsilo.

Læs også: Forskersøgemaskine kan løse videnparadoks

»Den uheldige side-effekt med Facebooks personalisering er, at du aldrig kommer til at læse indlæg fra folk, du er uenig med. Det bliver et ekko-kammer, hvor alle står og råber det samme. Det bliver vi ikke klogere af,« siger Mads Rydahl, der blandt andet var design- og produktchef på den personlige digitale søgemaskine Siri, der blev solgt til Apple og udbredt til millioner af iPhones verden over.

Google er heller ikke meget bedre ifølge Mads Rydahl:

»De har en grundlæggende interesse i at pege dig hen imod det, der er penge i. Det vil sige de store og mest populære sites. Problemet er, at hvis du altid fik det mest populære resultat, så ville du aldrig kunne opfinde noget, fordi du aldrig opdagede noget nyt,« siger han.

Ny teknologi forstår betydningen af det, vi skriver

Unsilo leverer søgeværktøjer til forskning og produktudvikling, der kan være et alternativ til Googles algoritmer, som handler om hele tiden at finde det mest populære og personligt relevante.

I stedet benytter de danske iværksættere sig af machine learning og software, der kan forstå vores almindelige sprog, Natural Language Processing - også kaldet NLP - til at analysere millioner af forskningsartikler og forstå betydningen af det, som forskerne har skrevet.

På den måde behøver forskere ikke kun at nøjes med at læse de mest citerede og mest populære publikationer. De er heller ikke længere begrænset af nogle enkelte keywords og af at skulle gætte sig frem til, præcis hvilke ord der bliver brugt i de mest relevante artikler.

Når Unsilo eksempelvis læser en artikel om insulin-følsomhed, så vil deres software også være i stand til at forstå, at nedsat hormon-respons er et relateret koncept, som skal inkluderes i søgeresultaterne. Sagt på en anden måde kan teknologien forstå synonymer og relaterede koncepter, så man kan søge med sine egne ord og stadig finde artikler, der taler om de samme problemstillinger, selvom deres forfatter har beskrevet dem på en anden måde og med andre ord.

Bølge af natural language processing-startups

Ideen om computere, der forstår menneskeligt sprog, er langtfra ny og stammer formentlig tilbage fra de første science fiction-scenarier om kunstig intelligens (AI).

Men siden iPhone-brugere begyndte at bede Siri om at lægge møder ind i kalenderen, skrive beskeder og spørge ‘hende’, hvordan vejret bliver i weekenden, er der sket en opblomstring af startups, der bruger NLP til at løse store og små problemer.

Startuppet X.ai, er ved at udvikle en e-mail-baseret personlig assistent ved navn Amy, der forstår folks ønsker og kan arrangere møder ved at skrive e-mails frem og tilbage uden at involvere mennesker i processen.

Læs også: Kunstig intelligens-projekt skal overtage dine kedelige arbejds-e-mails

Og på et endnu mere højtsvævende plan er der Viv. Projektet er omgærdet af mystik, og udviklerne vil ikke give nogen interviews. Endnu. Holdet bag Viv består blandt andet af flere af Mads Rydahls tidligere kolleger fra Siri, som nu arbejder på det, de kalder den oprindelige vision med Siri: at skabe en selvlærende AI-assistent - en global hjerne, der kan forstå og svare på stort set alle slags spørgsmål. Den husker alt, hvad du fortæller den, lærer dine præferencer og kan hjælpe dig med at vælge mellem forskellige services eller finde den mest pålidelige sælger af et bestemt produkt. Som eksempelvis at bestille en vogn fra ens foretrukne taxatjeneste, der kan køre dig hjem, når du fortæller den, at du er fuld.

Faktisk stammer ideen til denne funktion tilbage fra 2008, før Mads Rydahl og hans kolleger havde skiftet navnet på deres opfindelse til Siri. De gik rundt på deres første konference med T-shirts, hvorpå der stod: 'Take me drunk, I’m home'. I dag foreslår Siri ganske vist en søgning efter den nærmeste taxatjeneste, hvis man siger, at man er fuld. Men ‘hun’ kan ikke gøre det hele automatisk, uden at man skal gøre mere, sådan som Viv skal gøre det ifølge teknologimediet Wired.

»Alle de her intelligente systemer handler om at automatisere velkendte områder. Det er spændende, at vi begynder at bruge maskiner til at hjælpe os med flere og flere af vores dagligdags opgaver,« siger Mads Rydahl.

Bag NLP-begrebet gemmer sig en teknologi, der forsøger at dekonstruere det menneskelige sprog og gøre det forståeligt for computeren. Det er især Stanford University, der baner vejen for forskning på området i øjeblikket, mens det endnu kniber med erfaringerne på de danske universiteter ifølge Mads Rydahl.

I sin essens handler NLP om at forstå syntaksen i sprog og de forskellige logiske sammenhænge. Når man siger: »Det er en god dag at surfe i,« så skal algoritmerne eksempelvis kunne fastslå, at 'det' refererer til 'i dag'.

Her er en af udfordringerne især, når ord har flere mulige betydninger, såsom det engelske 'bass'. Alt afhængig af konteksten kan teknologien afgøre, om der er tale om dyb tone eller en aborre.

Både Apples Siri, Microsofts Cortana og Googles Now-tjenester benytter sig af NLP til at forstå og udføre simple kommandoer. Men selvom løfterne er høje, er det endnu begrænset, hvad man kan få computere til at gøre med stemmen, også selvom de har adgang til så stor en database af viden, som Google byder på.

Google Now kan eksempelvis svare på spørgsmålene: »Hvornår blev Abraham Lincoln født?« samt hvor mange indbyggere der er i en given by. Men den kan ikke forstå spørgsmålet: »Hvor mange indbyggere er der i den by, hvor Abraham Lincoln blev født?«

Den slags udfordringer er en af de nuværende begrænsninger i NLP-teknologien, som blandt andet Viv Labs forsøger at løse.

Fra larmende serverracks på kontoret til Amazon-skyen

Hverken Siri, Cortana, Google Now eller Unsilos teknologi til forskere ville kunne eksistere for 20 år siden.

Udviklingen inden for NLP er nemlig i høj grad afhængig af computerkraften, der som bekendt har fulgt Moores lov og udviklet sig eksponentielt. Når Unsilo skal analysere teksten i millioner af dokumenter med machine learning, kræver det en computerkraft som kun datacentre kan levere.

Da Mads Rydahl arbejdede med Siri i årene før opkøbet i 2010, kørte tjenesten ellers på servere, der stod på deres eget kontor i San Jose. De startede med nogle enkelte racks, men det udviklede sig til sidst til over 100 maskiner, der stod og summede på kontoret.

»Det larmede helt vildt,« siger Mads Rydahl.

I dag bruger Unsilo og andre machine learning-startups især Amazon-skyen til deres teknologi. På den måde kan de skalere op og ned for computerkraften alt efter behov.

For et par uger siden analyserede Unsilo flere millioner artikler med NLP for det videnskabelige forlag Springer Nature. På en almindelig stationær computer ville det arbejde have taget 171 år at udføre. Men når datacentret træder til, tager det kun et par dage.

Startup-land: Version2 sætter fokus på pionererne. It-iværksætterne, som sætter teknologiske milepæle og er med til at forandre brancher. Kender du nogle, så giv os et praj på ecl@version2.dk.

Tips og korrekturforslag til denne historie sendes til tip@version2.dk
Følg forløbet
Kommentarer (1)
sortSortér kommentarer
  • Ældste først
  • Nyeste først
  • Bedste først
Mie Kusk

Det er nogle ganske interessante betragtninger du kommer med her. Specielt de personificerede søgninger deler ofte vandende, da mange som du siger, ofte finder relaterede ting i deres feed, mens andre som dig savner lidt støj i den "mainstream" man ellers får servret hver dag.Når jeg læser om Viv tænker jeg straks Skynet, men det er jeg nok ikke ene om;)
Tak for godt indspark

  • 1
  • 0
Log ind eller Opret konto for at kommentere