Her er søgemaskine-paradokset, som Google ikke har løst

En uhensigtsmæssighed i Google’s algoritmer rammer en særlig type virksomheder og gør, at deres indhold aldrig dukker op på søgemaskinen. »Svært at løse,« siger ekspert.

Begrebet nål i en høstak kommer end ikke tæt på at beskrive Googles enorme database med hjemmesider, som man kan søge i.

Så skal det i hvert fald være en nål gemt i en høstak med 47 milliarder strå, for det er netop antallet af hjemmesider, som Google har indekseret.

Konstant er virksomhedens automatiske spejder Googlebot på udkig efter nye hjemmesider til samlingen, og det massive indsamlingsarbejde kræver derfor nogle snedigt udtænkte algoritmer, som afgør, hvad man kan finde, når man »googler« noget.

Men selvom Google har haft snart 20 år til at raffinere algoritmerne, så de lige præcis udvælger det mest relevante for brugerne, så sker det alligevel en gang imellem, at noget falder igennem.

En uhensigtsmæssighed som egentlig skulle gøre det lettere for alle at finde det de søger, men som kan ende med at gøre det sværere.

»Det er sådan med Google, at når de skal lave en algoritmisk vurdering på tværs af flere milliarder af dokumenter, så vil der altid være fejl,« siger ekspert i søgemaskineoptimering og administrerende direktør for rådgivningsvirksomheden Waimea Digital, Mikkel ‘deMib’ Svendsen, og fortsætter:

»Nogle gange er noget af det, vi ved er bedst for brugerne, ikke altid det, som Google vægter højest.«

Det kan nogle gange ende i et paradoks, hvor virksomheder må gå imod søgemaskinens anbefalinger for, at brugerne kan finde det, de søger efter, på søgemaskinen.

Læs også: Sådan bliver ikke-mobilvenlige websider ramt af Googles karate-spark

Rammer søgninger på enslydende produkter

En af Googles styrker som søgemaskine er, at man hurtigt kan finde forskellige relevante resultater, når man søger efter noget.

Søger man eksempelvis på ‘Krigen mod terror’, dukker der både resultater op fra Wikipedia, Gyldendals Store Danske, aviserne Information, Berlingske og Ekstra Bladet samt fra Amnesty.

Googles algoritmer har nemlig sørget for at variere indholdet og i øvrigt frasortere det, som er alt for enslydende. De færreste ville nok være tilfreds med at blive præsenteret for 10 links til den samme artikel, når de søgte på emnet.

Denne frasortering har dog samtidig en bagside, fortæller Mikkel ‘deMib’ Svendsen, der har arbejdet med søgemaskineoptimering siden Googles spæde start i 1996.

»Nettets arkitektur er enormt anarkistisk. Det er fedt nok, men gør det vildt besværligt for søgemaskiner, så de nogle gange ender i nogle situationer, hvor deres filtrering ikke er den bedste,« siger han.

Et eksempel på dette er når man søger efter meget specifikke og ofte tekniske produkter. Det har en elektronikvirksomhed - der af hensyn til sin placering på Google forbliver anonym - oplevet.

Virksomheden har omkring 120.000 forskellige elektroniske dimser som fx transistorer til salg på sin hjemmeside, hvoraf mange af dem er stort set ens, men kun varierer på få tekniske parametre som eksempelvis impedans.

»Problemet med de 120.000 produktsider er, at indholdet på siderne er næsten ens, så det er umuligt at skrive en meningsfuld tekst for alle de enkelte produkter. Og så har Google som udgangspunkt et filter, der frasorterer siderne, fordi det vurderer, at produkterne er ens,« siger Mikkel ‘deMib’ Svendsen.

Konsekvensen er, at brugerne ikke kan finde de enkelte produkter med de nøjagtige tekniske specifikationer, når de søger efter dem på Google. Og det er sådan, de fleste ellers normalt ville gøre det ifølge søgemaskine-eksperten.

Problemet begrænser sig dog ikke kun til elektronikvirksomheden.

»Det er en problematik, som dukker op for virksomheder, som har mange forskellige produkter, som på nær enkelte faktuelle forhold ligner hinanden, eksempelvis computer-hardware, skruer, brædder og tekstilproduktion,« siger Mikkel ‘deMib’ Svendsen, som ikke mener, at det gavner brugerne, når de mange enslydende sider bliver fravalgt.

»Jo mere præcist Google kan forbinde den enkelte søgning med det rette webdokument desto bedre. Googles succes er summen af alle de mikrosucceser, hvor den enkelte finder det, som vedkommende leder efter,« siger han.

Uortodoks løsning

For ikke at blive frasorteret i søgningerne, er det nogle gange nødvendigt at ‘snyde’ søgemaskinen.

Det endte elektronikvirksomheden således også med at gøre.

Ved indsætte en autogenereret tekst på hver enkelt produktside, lykkedes det at narre Googles algoritmer, så hvert enkelt produkt blev indekseret og derfor kan findes direkte, når man søger efter det.

Det fungerer ved, at man tager udgangspunkt i en tekst og så laver en masse variationer af den, som man lægger ind på hver enkelt side. Variationerne bliver automatisk konstrueret ved at tage synonymer eller ensartede ord og skifte dem ud med hinanden i forskellige kombinationer.

Eksempelvis kan »Manden løber på gaden« blive til »Kvinden hinker på fortovet«. På den måde tror Google, at der er tale om forskelligt indhold, selvom det i realiteten langt fra er tilfældet.

»Bagsiden er, at det hverken er specielt elegant, smukt eller brugervenligt,« siger Mikkel ‘deMib’ Svendsen.

Google opfatter da også officielt den slags kneb som spam, men ser alligevel igennem fingre med det i praksis, hvis det giver mening for brugerne ifølge søgemaskine-eksperten.

»Der er altså en forskel på, hvad Google siger, vi ideelt set bør gøre som webmastere, og så det vi bliver nødt til at gøre i praksis,« siger Mikkel ‘deMib’ Svendsen, som tidligere har gjort Google bekendt med problemet.

Google erkendte dengang problemet, og ville forsøge at finde en løsning på det. Men det er endnu ikke sket ifølge søgemaskine-eksperten.

»Problemet med de her komplekse mekanismer er, at hvis du piller i en ende, så sker der ting i den anden ende, som du ikke havde regnet med,« siger Mikkel ‘deMib’ Svendsen.

Med andre ord vil det kunne gå ud over alle de andre søgeresultater, hvis Google skal begynde at medtage resultater over sider, der ligner hinanden meget.

Kunsten består derfor i at finde en løsning, som på den ene side gør det muligt at finde nålen i høstakken uden, at man drukner i hø.

»Det er ikke så enkelt at løse, så jeg kan godt forstå, at de ikke har tryllet en løsning frem,« siger Mikkel ‘deMib’ Svendsen.

Google har ingen kommentarer til sagen.

Når algoritmerne fejler: Kender du til nogle lignende eksempler på paradokser i algoritmerne? Så hører vi meget gerne fra dig på redaktion@version2.dk.

Tips og korrekturforslag til denne historie sendes til tip@version2.dk
Følg forløbet
Kommentarer (10)
sortSortér kommentarer
  • Ældste først
  • Nyeste først
  • Bedste først
Rune Jensen

Algoritmerne er lavet bla. fordi ellers kan man bare kopiere tekst fra en konkurrents side.

Kunsten er i virkeligheden at bygge noget salgstale. Og det er svært, hvis man har 10000 produkter, ja. Men i teorien er det jo muligt. Problemet er mest tiden, som skal bruges på det for at få en individuel tekst på hvert produkt. Så det er de ekstra penge det koster at lave den individuelle salgstale, som er problemet.

5 minutter ekstra brugt på individuelt at sælge et produkt gange 10000. Tjoh... Og nu ved jeg ikke hvad en tekstforfatter tager i timen, men nok ikke helt billigt.

Til gengæld bliver det så meget mere elegant. Og helt klart man kan spotte sider, som har taget sig tiden.

Men iøvrigt er der jo andre parametre man kan skrue på, og en ting er enhedspris. Som gør man kan komme i top på diverse mega-prisindexes for elektronik. Hvis nu man ikke kan nå Google.

En anden ting er reputation, som jeg også plejer at bruge som en parameter. Det er lidt vigtigt hvad andre siger i bla. forums om dette og hint firma. Leveringspræcision og sådan. Jeg bruger altså ikke kun google til at afgøre mine indkøb.

Christian Nobel

Så kunne de enkelte sideejere jo passende gøre søgning på deres egen side bedre.

Eksempelvis dette medie har en direkte elendig søgemekanisme, så det er nemmere at lave en googlesøgning på version2 + det-man-nu-skal-prøve-at-finde-igen.

Og det er tilsvarende for de fleste andre aviser.

Det burde kunne gøres bedre.

David Konrad

Den indledes med en diffus påstand, fortsætter med lidt sniksnak og først omkring midten af artiklen konkretiseres indholdet i form af et - i øvrigt - ikke verificerbart eller reproducerbart "eksempel". Det er tydeligvis ikke version2 selv der har lugtet en god historie, og efter research og granskning af opsnusede type-eksempler har fået ekspertbistand til at formidle et stykke journalistik. I øvrigt tror jeg ikke på den - og det er jo nok derfor vi ikke præsenteres for noget konkret. 120.000 forskellige produkter vil også kunne fremsøges i google, altså hvis de besidder unikke produktnavne, man har skruet sine produktsider rigtigt sammen og man søger på det unikke produktnavn; det vil ikke blive frasorteret i kraft af et mystisk filtrerings-"paradoks". Derudover kan samtlige produkter inddeles i kategorier, og underkategorier, med en myriade af linkbuilding-muligheder, varierede titles, headere, landingpages for kategorier der linker til produkterne osv. Det er en simpel programmeringsopgave. Men bevares, har man "transistor a1", "transistor a2", "transistor a3", og ikke leverer andet til google - og man så søger på "transistor", så vil google stensikkert kun formidle et randomiseret udvalg af 1 (een) transistor indenfor kategorien. At løse svag indeksering på det enkelte produkt med noget blackhat spamdexing virker ikke som en særlig holdbar løsning på sigt.

Rune Jensen

Så kunne de enkelte sideejere jo passende gøre søgning på deres egen side bedre.

Oh. Men det er jo ikke (kun) SEO trick, men gode gamle Jacob Nielsen. Har et par gange gjort opmærksom på, at brugervenlighed og tilgængelighed skam også ligger i den interne søgefunktion.

Fordi ikke alle bruger menuerne. Nu kan jeg ikke huske lige procenterne. Men lad os bare sige omkring 20% som foretrækker søgefunktionen.

Men altså summa summarum "Ingen søgeresultater fundet", det er det samme som at sige "Ja, bare gå til en anden side, vi har ikke hvad du ønsker her."

Google selv har det jo faktisk aldrig - vel... De har altid et resultat uanset hvad du søger på.

Men det er så utroligt underligt hvor lidt vægt der bliver lagt på den funktion selv på større sider. Det er som om, ja, menuerne er det som alle bruger, men en søgefunktion ser "pæn" ud så lad os bare have sådan en for udseendets skyld.

useit.com søgefunktionen på term: search function
http://www.nngroup.com/search/?q=search+function

Allan S. Hansen

At rangerer "spunnet" produkttekster, er netop noget af det Google er på vej væk fra med nogle af deres senere algoritme ændringer - fordi de vurderer det ikke giver deres brugere meget værdi. Disse tekster er måske unikke, men de er sjældent normale, informative, kundeorienterede tekster. Der er SEO tekster ment at "snyde" algoritmen for at lokke kunder ind.

Hvis man har 200.000 produkter så ens at Google ikke viser alle 200.000 hits hvis man søger på noget "generelt", så er problem ikke automatisk Googles. Der er struktur ændringer man kan foretage på sin shop, således man ikke behøver 200.000 "unikke" tekster som er stuffed med 8 keywords 5 gange og som bliver "spunnet" automatisk således det fremtræder "unikt" på alle 200.000 produkter.

Eksempelvis, lige så vel som man har sitemaps, kan man have "model maps" til produkter, specifikations "maps", man kan lave simple længde/størrelse vælgere, der gør at man ikke behøver eksponerer hvert produkt som en unik side m.m. Optimer interne søgninger, gør søgningen nem og intuitiv at bruge, kom med forslag/synonymer/relationer.
Tænk brugeroplevelse direkte ind i siden og brugsflow. Tænk social network, hvilket tæller mere og mere for Google.
Omnichannel/Crosschannel er vigtigere for kunderne nu til dags.

Så er man mindre afhængig af at Google finder det unikke produkt 175.412 med den automatiske spunnet produkttekst på en traditionel søgning, fordi der er andre måder og tekster som brugerne kan ledes ind på sitet, og stadigvæk fra Google.

Christian Nobel

Hvis man har 200.000 produkter så ens at Google ikke viser alle 200.000 hits hvis man søger på noget "generelt", så er problem ikke automatisk Googles.

Jeg ville da også hellere som komponent leverandør have budskabet ud om at jeg var leveringsdygtig i over 200.000 transistorer, underforstået ligegyldig hvor eksotiske transistorønsket er, så kan jeg levere.

Og når kunden så kom ind på min side, så skulle det være nemt og hurtigt for ham at finde en 2N3055 samt ækvivalente - dvs. min egen søgning skulle være meget bedre end det man vanligt ser.

Log ind eller Opret konto for at kommentere
Pressemeddelelser

Welcome to the Cloud Integration Enablement Day (Bring your own laptop)

On this track, we will give you the chance to become a "Cloud First" data integration specialist.
15. nov 2017

Silicom i Søborg har fået stærk vind i sejlene…

Silicom Denmark arbejder med cutting-edge teknologier og er helt fremme hvad angår FPGA teknologien, som har eksisteret i over 20 år.
22. sep 2017

Conference: How AI and Machine Learning can accelerate your business growth

Can Artificial Intelligence (AI) and Machine Learning bring actual value to your business? Will it supercharge growth? How do other businesses leverage AI and Machine Learning?
13. sep 2017
Jobfinder Logo
Job fra Jobfinder