Nu kan du tale til Google på baskisk og islandsk - men stadig ikke på dansk
Du kan nu søge på Google blot ved at tale til din Android-mobil. Du skal blot tale et af de 42 andre sprog end dansk.
Google har netop udvidet muligheden for Voice Search til Android med 13 nye sprog, heriblandt de skandinaviske sprog svensk, norsk og finsk i tilgift til en række mindre sprog som baskisk, galicisk og islandsk.
Men dansk er altså endnu ikke understøttet af Googles Voice Search.
Google oplyser i et blogindlæg, at det kræver mange frivillige at få opbygget en ordbog til hvert sprog.
Det gælder især for sprog som eksempelvis svensk, hvor der skal indtales tusindvis af ord og fraser, som Googles teknikere derefter skal omsætte til noget, der kan genkendes af en maskine.
Kommentarer (7)
Man skulle tro at der var nogen ude på universiteterne, som kunne få et godt stat/EU-finansieret forskningsprojekt ud af at hjælpe google med dansk talegenkendelse.
Man skulle tro at der var nogen ude på universiteterne, som kunne få et godt stat/EU-finansieret forskningsprojekt ud af at hjælpe google med dansk talegenkendelse.
Det paradoksale er, at den danske stat allerede for 8 år siden afsatte seks millioner kroner til at udvikle dansk talegenkendelsesteknologi med afsæt i data fra DR's udsendelses- og tekstarkiver.
http://www.computerworld.dk/art/106332/groent-lys-for-dansk-talegenkendelse
Fra artiklen (skrevet af Dorte Toft):
Danskerne kan takke de hørehæmmede for, at der omsider vil blive udviklet software, så computere kan "oversætte" det talte danske sprog til tekst. Videnskabsministeriet, Kulturministeriet, Danmarks Radio og TV2 står bag en bevilling på seks millioner kroner til udvikling af dansk talegenkendelse.
Jeg har ikke haft adgang til den endelige kontrakt fra dengang, men i kontraktudkastet står der, at staten ejer de resulterende tale-til-tekstdatabaser, og derved i princippet har ret til at licensiere disse til enhver, som måtte ønske det:
Kunden har ejendomsret, ophavsret og enhver anden rettighed til det i Bilag B angivne programmel og databaser, som er udviklet særligt til Kunden, samt til den dertil hørende programdokumentation (herunder kildekoder). For så vidt angår specielt tilpassede programmer, gælder dette dog kun selve tilpasningen og ikke det oprindelige program. Kunden har som følge af sine rettigheder til det i Bilag B angivne programmel og databaser ret til at give tredjemænd en ikke eksklusiv brugsret til programmellet og databaserne til brug for kommercialisering af tale-til-tekst systemer.
Det kan således godt undre mig, at det skal tage Google så lang tid at udvikle understøttelse af dansk talegenkendelse, hvis de nødvendige data virkelig er så relativt let tilgængelige.
En efterfølgende pressemeddelelse fra 2006:
http://fivu.dk/nyheder/pressemeddelelser/2006/dansk-talegenkendelse-vind...
Projektet består af en broadcast-version, der gør det muligt for tv-stationer at tekste deres live tv-udsendelser, reportager og lignende. Desuden vil der senere i år komme en forbrugerversion af programmet på gaden, som vil give almindelige brugere af en pc muligheden for at tale direkte til computeren, som så oversætter til tekst.
Bevillingen på seks millioner kroner blev i øvrigt efterfulgt af en helt ekstraordinær tillægsbevilling på 550.000 kroner, som blev godkendt af Folketingets Finansudvalg i 2008 for at gøre det økonomisk muligt for den oprindelige leverandør at opgradere sin software fra kun at understøtte 32-bit Windows XP til også at kunne understøtte 32-bit Windows Vista:
Når de alligvel har fået svensk på programmet burde det jo ikke gå lang tid...
I mellemtiden, kan jeg drage nytte af 6 års ophold i stockholm med resultat i flydende svensk :)
Er der ingen danske medier der har kontaktet google og bedt om en kommentar på hvorfor island, sverige, norge og finland er med før DK?
Det er vel underordnet eller i bedste fald, ikke særlig interessant.
Jeg mener, om det skyldes at der er flere indbyggere i de omtalte lande eller om det er fordi de bedre kan lide disse lande, så er det til syvende og sidst Googles suveræne beslutning.

