Google lancerer ny søgemaskine til forskere

Illustration: Google
Er især målrettet forskere, og andre der søger efter datasæt.

På sin blog har Google nu annonceret en ny søgemaskine. Den hedder Dataset Search og er et nyt initiativ, der skal gøre søgningen af relevant information enklere.

Som navnet antyder, er den nye søgemaskine målrettet personer, som har behov for at finde datasæt i forskellige sammenhænge. For eksempel til forskning eller i virksomheds-øjemed.

Millioner af datasæt

Google peger på, at der findes tusinder af samlinger med data på internettet, der igen indeholder millioner af datasæt. Hensigten med den nye søgemaskine er altså at gøre det lettere at finde disse frem uden at skulle trawle gennem massevis af irrelevante søgeresultater på Google.

Den nye tjeneste fungerer ifølge Google lidt på samme måde som den eksisterende tjeneste Google Scholar, som indekserer hele tekster eller metadata for akademisk litteratur på nettet på tværs af formater og discipliner.

Det indebærer, at Dataset Search styrer brugerne til datasæt, hvor de hostes, som for eksempel på udgiverens egen netside, på et digitalt bibliotek eller på en forfatters egen hjemmeside.

Åben standard

På udviklersiden har Google annonceret sine egne retningslinjer, som bør følges for at gøre datasættene enklest muligt at finde, som at opgive både navn, beskrivelse, forfatter og distributionsformat.

Det samme gælder tidspunktet for publicering, og hvordan data blev indsamlet.

Dataene beskrives af en åben standard kaldet Schema, som Google opfordrer alle udbydere af datasæt til at bruge for at gøre tjenesten best mulig.

Dataset Search fungerer på flere forskellige sprog, men indtil videre er antallet af tilgængelige datasæt nok noget begrænset. Tjenesten er stadig i beta og skal nu videreudvikles.

Dennne artikel stammer fra digi.no.

Tips og korrekturforslag til denne historie sendes til tip@version2.dk
Kommentarer (3)
sortSortér kommentarer
  • Ældste først
  • Nyeste først
  • Bedste først
Anne-Marie Krogsbøll

Man kan også bruge den til at finde datasæt som er "anonymiserede", men som man kan deanonymisere ved at kombinere informationer fra flere datasæt eller andre åbne datakilder.

Ja - grimt scenarie, hvis danske myndigheder og forskere hopper på den limpind - sikkert netop med undskyldningen, at data er "anonymiserede". Mit gæt: Det gør de. Men det kunne være rart at få en reaktion fra de pågældende myndigheder, om det er noget, man har i sinde at anvende.

Nu er det vel ikke selve data, man lægger ud, men blot oplysninger om, hvor de kan skaffes - så der skal vel stadig søges om tilladelse fra danske myndigheder. Men det vil vel stadig gøre risikoen for farlig samkøring meget større. Med mindre de danske myndigheder og forskere vil ud og tjekke, hvordan data anvendes i praksis i al fremtid.

Log ind eller Opret konto for at kommentere