Nu kan du tale til Google på baskisk og islandsk - men stadig ikke på dansk

Googles søgefunktion til Android, hvor man kan indtale sin søgning, har fået tilføjet 13 nye sprog, men stadig ikke dansk.

Du kan nu søge på Google blot ved at tale til din Android-mobil. Du skal blot tale et af de 42 andre sprog end dansk.

Google har netop udvidet muligheden for Voice Search til Android med 13 nye sprog, heriblandt de skandinaviske sprog svensk, norsk og finsk i tilgift til en række mindre sprog som baskisk, galicisk og islandsk.

Men dansk er altså endnu ikke understøttet af Googles Voice Search.

Google oplyser i et blogindlæg, at det kræver mange frivillige at få opbygget en ordbog til hvert sprog.

Det gælder især for sprog som eksempelvis svensk, hvor der skal indtales tusindvis af ord og fraser, som Googles teknikere derefter skal omsætte til noget, der kan genkendes af en maskine.

Tips og korrekturforslag til denne historie sendes til tip@version2.dk
Kommentarer (12)
sortSortér kommentarer
  • Ældste først
  • Nyeste først
  • Bedste først
ab ab

Man skulle tro at der var nogen ude på universiteterne, som kunne få et godt stat/EU-finansieret forskningsprojekt ud af at hjælpe google med dansk talegenkendelse.


Det paradoksale er, at den danske stat allerede for 8 år siden afsatte seks millioner kroner til at udvikle dansk talegenkendelsesteknologi med afsæt i data fra DR's udsendelses- og tekstarkiver.

http://www.computerworld.dk/art/106332/groent-lys-for-dansk-talegenkendelse

Fra artiklen (skrevet af Dorte Toft):

Danskerne kan takke de hørehæmmede for, at der omsider vil blive udviklet software, så computere kan "oversætte" det talte danske sprog til tekst.

Videnskabsministeriet, Kulturministeriet, Danmarks Radio og TV2 står bag en bevilling på seks millioner kroner til udvikling af dansk talegenkendelse.

Jeg har ikke haft adgang til den endelige kontrakt fra dengang, men i kontraktudkastet står der, at staten ejer de resulterende tale-til-tekstdatabaser, og derved i princippet har ret til at licensiere disse til enhver, som måtte ønske det:

Kunden har ejendomsret, ophavsret og enhver anden rettighed til det i Bilag B angivne programmel og databaser, som er udviklet særligt til Kunden, samt til den dertil hørende programdokumentation (herunder kildekoder). For så vidt angår specielt tilpassede programmer, gælder dette dog kun selve tilpasningen og ikke det oprindelige program. Kunden har som følge af sine rettigheder til det i Bilag B angivne programmel
og databaser ret til at give tredjemænd en ikke eksklusiv brugsret til programmellet og databaserne til brug for kommercialisering af tale-til-tekst systemer.

Det kan således godt undre mig, at det skal tage Google så lang tid at udvikle understøttelse af dansk talegenkendelse, hvis de nødvendige data virkelig er så relativt let tilgængelige.

En efterfølgende pressemeddelelse fra 2006:

http://fivu.dk/nyheder/pressemeddelelser/2006/dansk-talegenkendelse-vind...

Projektet består af en broadcast-version, der gør det muligt for tv-stationer at tekste deres live tv-udsendelser, reportager og lignende. Desuden vil der senere i år komme en forbrugerversion af programmet på gaden, som vil give almindelige brugere af en pc muligheden for at tale direkte til computeren, som så oversætter til tekst.

Bevillingen på seks millioner kroner blev i øvrigt efterfulgt af en helt ekstraordinær tillægsbevilling på 550.000 kroner, som blev godkendt af Folketingets Finansudvalg i 2008 for at gøre det økonomisk muligt for den oprindelige leverandør at opgradere sin software fra kun at understøtte 32-bit Windows XP til også at kunne understøtte 32-bit Windows Vista:

http://www.oes-cs.dk/aktstykker/0809-008.pdf

  • 2
  • 0
Tine Andersen

DR's simultantekstning i TV-avisen (og især Vejret), så er den under al kritik! Prøv engang selv at sætte tekstning på for hørehæmmede, det er det rene volapyk.

Nu bruger jeg teksten som støtte til det, jeg trods alt kan høre, men tekstningen er tit fuldstændig meningsløs: At plantisk luft? (Atlantisk luft).

Så selvom det har fået over 6 mio i støtte er det rystende ringe.
Det bruges også kun de to steder, så fx sportsbegivenheder og Eurovision Song Contest- er umulige at følge med i.

Dansk er forresten et af de sværeste sprog i verden, vi sluger stavelserne, udtaler ting, der staves ens forskelligt- og omvendt. De øvrige nordiske sprog udledt af samme sprogstamme er meget nemmere at lære.

Mvh
Tine- der hører marginalt bedre end en dør

  • 1
  • 0
Peter Stricker

Så du mener, sådan helt seriøst, at der er flere indbyggere i ISLAND (under en halv million) end Danmark (ca. 6 millioner)?


Det var da ikke det, Søren skrev. Han opstillede to mulige årsager til Googles valg, og konstaterede, at uanset årsagen, så var det Googles eget valg. At betingelserne for den første af årsagerne ikke er opfyldt, er ikke relevant for konklusionen, og betyder ikke nødvendigvis, at betingelserne for den anden årsag er opfyldt, da Søren ikke påstår at listen af mulige årsager er udtømmende.

Helt ærligt, du har haft trekvart år til at læse og forstå kommentaren.

  • 1
  • 0
Tine Andersen

Er ikke blevet bedre!
De genudsender tit "En by i provinsen"- den er ikke tekstet!

De udsender fortsat Eurovision Song Contest, tekstet, hvor de ikke taler engelsk. For alle forstår jo Engelsk?! Men ikke volapük?
Bemærk venligst: Vi betaler også fuld medielicens.

Mvh
Tine- der er rigtig mange ældre danskere med hørehandikap. Vi er ikke allesammen fru Møghe: HVAD SIGER DU; HANS CHRISTIAN?!

  • 1
  • 0
Log ind eller Opret konto for at kommentere