Talegenkendelse skal gøre Windows Phone 7 til en succes

Microsoft satser kraftigt på talegenkendelse, så den kommende Windows Phone 7 kan betjenes med munden. Det bliver et vigtigt salgsargument for mobilplatformen.

Glem fingeraftryk på skærmen. Står det til Microsoft, skal talte kommandoer til din smartphone blive den vigtigste input-vej fremover.

I hvert fald satser firmaet nu massivt på talegenkendelse til Windows Phone 7-platformen, som lanceres i løbet af efteråret. Det skriver Infoworld.com.

Microsoft opkøbte i 2007 firmaet Tellme, som var specialister i talegenkendelse via en tjeneste i skyen, og meningen er, at Windows Phone 7 skal integreres tæt med denne tjeneste.

Ærkekonkurrenten Google har allerede lanceret talegenkendelse i Android-telefonen Nexus One, hvor man blandt andet kan skrive en sms blot ved talens kraft. Men ifølge Microsoft bliver talegenkendelse langt mere centralt i Phone 7.

»Vi tror på, at talegenkendelse ikke er en separat applikation. Det skal snarere være en integreret del af hele brugeroplevelsen,« sagde Zig Serafin fra Microsoft på Speechtek 2010-konferencen i New York, ifølge Infoworld.

Her blev det demonstreret, hvordan man kan bede telefonen ringe til en bestemt person, åbne billedfremviser, finde en restaurant i nærheden og andre funktioner i Phone 7, med stemmekommandoer.

Og de muligheder skal være med til at få folk til at hoppe på Windows Phone 7, i et marked hvor Android stormer frem og Apples iPhone også nyder enorm succes. Der blev således også plads til at drille konkurrenterne.

»De fleste smartphones består af rækker af ikoner, meget ligesom Windows 3.1,« lød det fra Zig Serafin.

Tips og korrekturforslag til denne historie sendes til tip@version2.dk
Kommentarer (16)
sortSortér kommentarer
  • Ældste først
  • Nyeste først
  • Bedste først
Anonym

Microsoft opkøbte i 2007 firmaet Tellme, som var specialister i talegenkendelse via en tjeneste i skyen, og meningen er, at Windows Phone 7 skal integreres tæt med denne tjeneste.

Imponerende - kombinationen af biometrisk overvågning via stemmegenkendelse uden for borgerens absolutte kontrol og cloud eliminerer al form for sikkerhed. Det er simpelthen teoretisk umuligt at sikre og uforsvarligt i en grad som ikke set før.

Stemmegenkendelse er glimrende, men biometri hører KUN hjemme på borgerens egne devices. Omsættelse af stemme til logisk kommando skal ske under borgerens kontrol fordi ellers bliver det til intravenøs kontrol med borgeren som samtidig er totalt åben for kriminel eller anden spoofing.

Opmærksomheden kan desuden henledes på at MS forrige forsøg på stemmebaseret adgangskontrol til computeren kunne hackes på afstand via computerens egen højtaler.

Tiltag som denne reducerer IE8-problemet til småting.

http://www.version2.dk/artikel/15705-reklamesaelgere-vandt-over-privatli...

  • 0
  • 0
Henrik Mikael Kristensen

Stemmegenkendelse er glimrende, men biometri hører KUN hjemme på borgerens egne devices.

Hvad hulen har stemmegenkendelse i forbindelse med almindelige brugerflader at gøre med biometri? Det skal vel ikke bruges til at godkende brugeren nogen steder, for jeg kan ikke forestille mig at bruge stemmebaseret authentifikation via en primitiv mikrofon i en mobiltelefon. (Men fremvis endelig ikke ideen for DanID).

Det svarer jo til at sætte lighedstegn mellem touch brugerflader og fingeraftryksgenkendelse i sikkerhedsøjemed.

  • 0
  • 0
Anonym

Ingen former for biometri bør bruges til sikkerhed uden for brugerens egne devices.

Problemet er et stemmen som anden biometri udgør en persistent og permanent identifier, dvs. opsamling udgør et stærkt overgreb. Og det skal være meget dårlige mikrofoner for at de ikke er gode nok hertil.

I den aktuelle verden drevet af marketingkanonernes profilering og bureaukratisk paranoia, er det ikke relevant at spørge om det vil blive misbrugt. Det kan man bare tage for givet - kvaliteten af selv de dårlige mikroner er rigeligt til at det vil blive misbrugt til tracking..

  • 0
  • 0
Anonym

Man kan forestille sig masser af problemer

Men der er forskel på at problematisere en konkret fejldesignet service som har problemerne evident integreret i selve servicen og så en eller anden semi-paranoid forestilling om flyvende kameraer etc.

Vi bør være langt mere bekymrede om den synlige systematiske og stærkt destruktive magtglidning fremfor noget "Big Brother".

Vi kan opnå det bedste af begge behov (service og borgeren i kontrol), hvis al talegenkendelse sker i egne devices som omsætter stemmen til digitale informationer som derved eliminere det individuelle.

Server-side og så endda cloud - no, no.

  • 0
  • 0
Jakob Damkjær

Det bedste stykke software til spech to text konvertering Dragon NaturallySpeaking så har de erfaring med mobil platforme fra deres jott service hvor man ringer til et nummer og taler sin besked ind og så dukker den op som text i din mail box eller Dragon Dictate til iPhone som bruger en cloud service til den faktiske oversættelse, så er der ca 65000 anmeldelser af den App så det er åbentbart en feature som nogen finder brugbar.

http://itunes.apple.com/us/app/dragon-dictation/id341446764?mt=8

Ellers kunne man godt tro at det var en unødvendig feature, men til at smse eller oprette et kundenotat mens man køre bil er selve ideen ikke dum og hvis det bliver en systemtjeneste så vil det da snildt kunne bruges i virkeligheden.

Ville dog tro at ms hellere skulle bruge developer krudtet på at få copy paste op og køre asap.

Men det er noget som ville være en unik system feature for WP7, hvis den virker...

/Jakob

PS! Om man så stoler på at sky tjenesten sletter ens stemme er lidt arbitrær da man aligevel i størstedelen af tilfældene har tænkt sig at sende data som stemmen bliver oversat over en mail eller sms... eller sende den ud til alle på internettet gennem facebook eller twiter.

  • 0
  • 0
Pernille Green

Øhh... "det bedste"?

Så vidt jeg kan se har det den store ulempe at det ikke fås på dansk. Og vi er vel mange der mest sms'er på dansk... Der findes faktisk noget tale-til-tekst til dansk.

Desuden: Stemmegenkendelse og talegenkendelse er helt forskellige ting.
- Stemmegenkendelse kan bruges til at afgøre hvem den der taler er (det virker OK men bliver vist ikke brugt ude i den virkelige verden).
- Talegenkendelse forstår hvad du siger (forhåbentlig).

  • 0
  • 0
Andreas Kirkedal

Stephan

Der er nu en forskel.
I speaker verification(stemmegenkendelse) laver de netop en unik identifikator af din stemme, hvor det ikke nødvendigvis er det man gør i talegenkendelse - selvom talegenkendelse som regel er mere robust når den er trænet på din stemme.

Ang. designet af servicen så er det rigtigt at det ville være bedst hvis processeringen foregik på telefonen, men så vidt jeg ved kræver det for meget processorkraft til at det er en mulighed.

  • 0
  • 0
Anonym

Selvfølgelig er der en forskel på hvad man gør, men ikke på hvad man KAN gøre. Det springende punkt er at om de biometriske data overhovedet forlader brugerens kontrol.

Det kræver mindre processorkraft at håndtere en specifikt oplært model end en generel model som forstår alle. Problemet er at forretningsmodellen og navnlig magtmodellen trækker skævt - igen, igen, igen.

  • 0
  • 0
Jesper Mørch

Ang. designet af servicen så er det rigtigt at det ville være bedst hvis processeringen foregik på telefonen, men så vidt jeg ved kræver det for meget processorkraft til at det er en mulighed.

Jeg kan tage fejl, men som jeg har forstået, kører det altså allerede clientside på Android 2.x
- Og det eksisterede så vidt jeg husker allerede i OS/2 Warp 4, som kørte fint på en Pentium 233 MHz.

Som Stephan så rigtigt pointerer, er problemet at det kommer forbi en 3.part hvor du ikke har kontrol med dit stemme-materiale. Du kan derfor kun håbe at der ikke er nogen der har koblet stemme-verifikation til den del af skyen som din indtaling kommer igennem.

Når man tænker på at de fleste virksomheder ønsker at tjene penge, og at der er rigtig mange penge i profiling af kunderne, ville jeg måske ikke dele forretnings-kritiske informationer med skyen på den måde...
Windows Phone er jo mest henvendt til erhvervslivet.

Ja, enhver kan jo tænke sit, men jeg begejstres ikke over muligheden for stemme-verifikation sammen med GPS og stemme-genkendelse - slet ikke i forb. m. en business-telefon.

  • 0
  • 0
Christian W. Moesgaard

Med nuværende metoder er det håbløst. Jeg kan godt huske talegenkendelsen i Windows 7. Hvilken joke... virker kun på Engelsk og selv da er den rædsom og misforstår alt hvad man siger til den.

Hvis de gør det her er Windows Phone 7 et flop allerede inden den er kommet på gaden.

  • 0
  • 0
Pernille Green

Jeg kan ikke udtale mig om talegenkendelsen i Win7 (har ikke prøvet den), men der findes udmærkede genkendere, også til dansk. Philips Speech Processing laver fx genkendere på mange sprog...

Og uden at ville fornærme dig, Christian, så er der rigtig mange danskere som taler engelsk med tilstrækkelig meget accent til at en engelsk genkender ikke forstår hvad de siger. Desuden kan det meget vel være en dårlig genkendelse der er indbygget i Win7. Talegenkendelse der virker er vist halvdyrt...

  • 0
  • 0
Esben Rasmussen

Microsoft opkøbte i 2007 firmaet Tellme, som var specialister i talegenkendelse via en tjeneste i skyen, og meningen er, at Windows Phone 7 skal integreres tæt med denne tjeneste.

Vil det så sige, at det man siger, som skal genkendes, lige skal op og vende i "skyen" hos denne tjeneste?

Lyder da som om det kan give nogle farlige og farligt irriterende situationer, hvis netværket pludseligt forsvinder.

Er det ikke meningen, at talegenkendelsen skal bruges som navigationsinstrument til telefonen som erstatning for/supplement til touch interface?

Hvis det er rigtigt, så svarer det lidt til, at lige mens jeg sidder og drejer på rattet i min bil, så holder bilen op med at lystre, fordi forbindelsen mellem rat og bil lige forsvandt?!

Jeg håber, at jeg tager fejl, for det er essentielt at vi har tillid til at vores navigationsinstrumenter (keyboard, mus, touch, joystick, rat osv.) altid virker - ellers vælger vi andre mere stabile måder at interagere med vores enheder på.

  • 0
  • 0
Log ind eller Opret konto for at kommentere
IT Company Rank
maximize minimize