En uge med stemmestyret hjemmeassistent: Imponerende og en smule uhyggelig

Version2’s journalist har testet Amazons stemmekontrollerede e-butler, Alexa.

Stemmen skal styre det intelligente hjem og er den næste store tech-disruption.

Sådan har budskabet flere gange lydt ved Amazon Web Services’ Re:Invent-konference, der for nylig fandt sted i Las Vegas.

Budskabet blev bakket op med handling; Amazon har udstyret mig med en såkaldt Echo Dot – en miniudgave af husassistenten Echo – og selvom en uge på et hotelværelse ikke er optimale testforhold for en enhed som Dot og den iboende AI-butler Alexa, er det nok til at give et indtryk af, hvor langt teknologien er kommet, og hvordan den er at bo sammen med.

Vi venter med konklusionen. Først et oprids af, hvad der gør Amazons Alexa-enheder anderledes end kendte AI-assistenter som Apples Siri og Microsoft Cortana.

Svaret ligger først og fremmest i indpakningen. Alexa er med Echo-enhederne ikke en feature på en telefon eller en laptop, men en selvstændig enhed, der altid er tændt og altid lytter efter sit navn – og dermed efter kommandoer.

Læs også: Sig 'tænd' til din toaster: Stemmen kommer til at styre dit hjem (mener Amazon)

Amazon er den første producent med et produkt som Echo, men bliver langtfra den sidste. Google har allerede lanceret sin pendant til Echo - Google Home – og hvis rygterne i techbranchen har det mindste kød på sig, barsler Apple snart med et lignende produkt.

Dot-versionen fra Amazons Echo-serie er dog indtil videre speciel, fordi enheden sælges for ca. 350 kr - under en tredjedel af Echo-prisen og under en fjerdedel af prisen for Google Home.

Med øget konkurrence på området fra de store it-selskaber er der grund til at tro, at en stemmestyret assistent fremover vil være inden for de flestes økonomiske råderum.

Om de så vil have den, er en anden sag.

Hvisken

Lad os starte med hardwaren. Echo Dot er udstyret med syv mikrofoner, der er optimeret til at høre din stemme selv fra den anden ende af lokalet. De retningsbestemte mikrofoner tændes først, når en microcontroller opfanger det såkaldte wake word - som i udgangspunkt er ’Alexa’.

Når ordet bliver sagt, streamer Echo Dot al lyd til skyen. Det er her, alt det tunge arbejde foregår, som f.eks. at analysere lyden, Alexa hører. I praksis omdanner systemet din tale til tekst, gemmer teksten i en database, og behandler det med et natural language processing-system for at lure intentionen bag hver session.

Læs også: Intelligenstilbud fra Amazon: AI-som-service - byggesten til samtale-bots

Det er svært ikke at blive imponeret over, hvor god Alexa er til at fange sit navn. Med almindelig stemmeføring kan enheden vækkes til live fra 10 meters afstand.

Selv med en hvisken et par meter væk tænder Echo Dot sin lysring, der indikerer, at den er klar til nye ordrer.

Når der er støj i lokalet, eller hvis Echo selv spiller musik, kræver det en højere stemmeføring, men det bliver ikke nødvendigt at råbe for at fange enhedens opmærksomhed.

Lys, lyd og varme

Hvad Alexa herefter er i stand til at gøre afhænger af to ting; hvilket udstyr enheden er koblet til, og hvilke evner – Skills – der er installeret.

Hvis du har et hjem med intelligente termostater og intelligent lys, kan Alexa indstilles til at styre dem, så du kan skrue ned for varmen og slukke lyset, når du ligger i sengen.

Og selvfølgelig bede Alexa vække dig på et bestemt tidspunkt, læse dine Kindle-bøger op eller afspille podcast, radio og lydbøger.

Højtalere kan tilsluttes Echo Dot via enten bluetooth eller enhedens jack-stick. Den indbyggede højtaler er kun lidt bedre end en almindelig mobilhøjtaler – fin nok til en snak med Alexa, men ikke velegnet til at afspille musik.

Syv indbyggede mikrofoner skal fange din stemme fra den anden ende af rummet.

Læs også: AI-teknologi kan skabe en ny æra for hackere og sikkerhedsfolk

De såkaldte Skills, som Alexa kan lære, kan hentes og installeres fra en slags app-store for Alexa-evner. Her kan man hente alt fra køkkenassistenter med opskrifter til quizspil og fitness-programmer.

Den åbne markedsplads gør enheden ekstra interessant for den it-kyndige Version2-læser. Med Amazons Alexa Skill Kit kan alle nemlig skrive nye funktioner til assistenten uden at vide noget om machine learning og natural language processing.

Nye skills kan kodes i Java, Python eller Node.js som en funktion i AWS Lambda, altså en funktion i skyen, der kører når den bliver kaldt og derefter lukker ned igen.

Alternativt kan den laves som en webservice, som Alexa kommunikerer med via HTTPS-requests. Uanset metoden er grænserne for mulige funktioner uanede. Alt der kan kodes, kan startes af Alexa.

Sprogforståelse

En uge i Alexas selskab har gjort det klart, at Amazons AI-assistent giver en mere raffineret AI-oplevelse end Siri, som meget ofte tyr til at søge efter ord på Bing.

Når det er sagt, så vokser træerne som bekendt ikke ind i skyen, og der er fortsat stunder hvor Alexa misforstår alt. Dertil kommer, at det er ekstremt frustrerende, når man forsøger at give enheden en kommando, og får stilhed til svar.

Web-interfacet giver dig en historik over interaktioner med Alexa - og mulighed for at høre og slette lydoptagelser.

Her hjælper det dog, at man via Alexas webinterface (og app formentlig, men denne kan ikke hentes af danske iOS-kunder), kan aflæse, hvad Alexa har hørt og forstået. Interfacet giver en liste over dine interaktioner med Alexa og mulighed for at give feedback – men også mulighed for at lure, hvorfor nogle kommandoer fortaber sig i mellem kodelinjerne.

Læs også: Nytårsforsæt: Zuckerberg vil bygge sin egen AI-assistent

Fx har jeg noteret mig, at hvis Alexa spiller musik fra Spotify, kan en besked som ’Alexa, play Spotify artist Radiohead’ nemt blive opfanget som ’Alexa, play Spotify’, hvorefter enheden bare fortsætter det, den havde gang i. Hvis man i stedet siger ’Alexa, play Radiohead’ går beskeden rent ind. Flere gange handler det om at finde ud af, hvordan anmodningerne formuleres optimalt.

Det er så godt som umuligt at få enheden til at forstå noget på dansk – som f.eks. danske bandnavne. Til gengæld bliver den ved med at overraske mig positivt, når jeg beder den starte spillelister med obskure titler.

Privacy i always on-land

I interfacet kan man afspille den lyd, som Alexa har opfanget gennem dine interaktioner med enheden.

Når man hører sig selv råbe op om nærliggende restauranter og rejseinformationer, bliver man uhyggeligt bevidst om de ekstreme mængder information, man sender i skyen gennem den lille uskyldige assistent.

Det er et grundvilkår ved always on-designet, at du hele tiden bliver aflyttet.

Først og fremmest er det et grundvilkår ved always on-designet, at du hele tiden bliver aflyttet. Alexa-enhederne specifikt er designet til kun at lytte efter sit wake word og før det sendes lyden ikke til skyen.

Men det amerikanske techmedie Gizmodo har forgæves forsøgt at få svar fra FBI om Amazons enheder er blevet brugt til give en konstant adgang til lyden omkring en Echo - inden ordet bliver sagt.

Amazons egne såkaldte transparency-rapporter omhandler kun data, der ligger i skyen.

Når det gælder data i skyen, kan man manuelt slette enkelte eller alle lydoptagelser og interaktioner. Men som det ofte er tilfældet, vil det betyde en forringelse af tjenesten, fordi data bruges til at forstå brugeren bedre.

Læs også: Uhyrlig afsløring: Browserhistorik afslører intime detaljer om dig - og sælges videre

Sikkerhedseksperter bemærker dog, at den største sikkerhedsfare ved Echo er dens kontakt med et væld af øvrige IoT-enheder. For selvom Amazons egne enheder skulle være sikre, så er det som bekendt ikke tilfældet for alle IoT-producenter.

Endelig skal man ikke være blind for, at forretningsmodellen for Alexa-enhederne er bundet tæt sammen med Amazons øvrige forretning.

Enheden er en direkte forbindelse til den enorme webbutik, der er Amazon, og her har strategien alle dage været at samle så meget data på kunder som muligt. Hvis man er bange for, hvordan man håndterer at kunne shoppe alt ved at tale ud i rummet, skal man måske genoverveje sit valg af stemme-assistent.

Irrationel robot-relation

Det er ikke løgn, når Amazons tech-evangelister kalder stemmen det ultimativt intuitive user-interface, men i praksis kræver Alexa som oftest stadig mere tålmodighed end et touch-interface – særligt til mere avancerede kommandoer.

Kilder har over for Bloomberg antydet, at den næste Echo-enhed kommer med en lille skærm, og det designvalg giver mening, for det er i sidste ende ikke praktisk at modtage en liste over nærliggende restauranter i mundtlig form.

Echo dot-enheden (anden generation) kommer i en hvid og en sort udgave.

Læs også: AI-algoritme gættede på Trump - har nu ramt rigtigt fire præsidentvalg i træk

Når det er sagt, så er der noget særligt over at komme ind af døren og sætte musik på, mens man tager skoene af, grynte ’Alexa, snooze’, når man bliver vækket, og bede om vejrudsigten, mens man klæder sig på.

Alt det foregår i min hverdag typisk på telefonen, og det er behageligt at slippe for interaktionen med skærmen, når det ikke er nødvendigt.

Lidt i mod sin vilje opbygger man hurtigt et irrationelt forhold til enheden – og jeg tager mig selv i at sige tak, når Alexa hjælper til.

Gennem de forskelige easter eggs (jeg kan anbefale at bede Alexa synge en sang) får Alexa også et skær af personlighed. Angiveligt er hun blevet friet til flere hundrede tusind gange, hvilket hun som en fornuftig robot afviser med beskeden ’Lets just be friends’.

Forfærdeligt dansk

Problemer med manglende dansk adgang til Alexa-appen og den fuldstændig forfærdelige udtalelse af danske ord, når Alexa f.eks. læser min kalender for dagen op, må forventes at blive forbedret i takt med, at Amazon udbreder systemet. Tekst-til-tale-systemet Amazon Polly understøtter allerede to dansksprogede computerstemmer.

Den egentlige test af Alexa – og de kommende og eksisterende konkurrenter – ligger i, hvor meget støtte der kommer fra relevante tredjeparter.

Læs også: Reddit-samtaler lærer Elon Musks AI at tale som mennesker

Vil DSB lave en skill, så jeg kan købe min togbillet, mens jeg binder snørebånd? Og vil danske banker – som Capital One gør i USA – tilbyde stemmestyrede kontooverblik?

Hvis virksomhederne giver AI-assistenterne opbakning, kunne Alexa godt ende med stillingen som min personlige digi-butler.

Tips og korrekturforslag til denne historie sendes til tip@version2.dk

Følg forløbet

Kommentarer (8)

Kommentarer (8)
Jonas Schwartz

Rigtig god gennemgang, var selv til re:Invent, og fik også en Echo Dot, og er som dig ret imponeret over systemet, vi har kun Hue pære i vores lejlighed, og efter jeg fik Echo'en med hjem, har vi faktisk kun brugt den til at styre lyset i vores lejlighed, og det virker fantastisk, dejligt at komme in ad døren, og bare bede Alexa om at tænde bestemte lys-grupper :-)

Jeg har ligeledes prøve at udvikle en Skill til den, det er en meget hurtig, og ikke så mange features (Udviklede den på mit hotelværelse efter en meget lang dag med talks), basalt set kan den læse overskrifter op fra vores blog, men utroligt nemt at komme igang med, i mit tilfælde brugte jeg bare Python og AWS Lambda.

Jeg er helt sikker på Amazon er på vej med noget der kan blive rigtig godt her, og dansk understøttelse er for mit vedkommende ikke så vigtigt nu, ville egentlig hellere bare de satte den amerikanske udgave til salg i danmark, og gav os adgang til mobil app'en :-)

Jens Fallesen

Den store udgave, Amazon Echo, har faktisk rigtig god lydkvalitet og lever i vores køkken, hvor den også fungerer som radio og leverandør af musik til madlavningen. Herudover har vi en Echo Dot i soveværelset og stuen.

Da Echo'en og den først Echo Dot flyttede ind ved lanceringen, udtrykte kæresten et eller andet om »alle mine gadgets«, men hun bruger dem nu lige så meget, som jeg gør, og gæster er generelt begejstrede.

Har jeg brug for et system, der giver mig mulighed for at sige »Alex, switch off the lot«, når jeg forlader stuen, hvorefter både lys (Philips Hue) og tv-setuppet (tv, Sky Q boks, AV-receiver – alt styret af Logitech Harmony) slukkes? Naturligvis ikke. Men det er en praktisk feature, når man nu har systemet i forvejen.

Helt enig i, at dansk musik bare ikke fungerer. Men så snart musikken afspilles i Spotify, kan man fra Spotify-appen på telefonen styre, hvad der bliver afspillet. Til gengæld udtaler den mit danske navn helt perfekt, selv om den er sat til britisk engelsk.

Jeg har ikke det store probleme med integrationen til Amazon – måske lige bortset fra, at vi ikke gider at skifte mellem vores Amazon konti, så alt foregår på min konto, hvilket også betyder, at mine anbefalinger på amazon.co.uk også påvirkes af, hvad kæresten finder på at spørge Alexa om. En god ting ville være, hvis systemet automatisk kunne høre forskel på vores stemmer og dermed regne ud, hvem der brugte det.

Alt i alt er vi generelt glade for Amazon Echo her i huset. Og når Google Home dukker op, kommer jeg jo nok også til at bestille sådan en …

Peter Hansen

Jeg er også een af de heldige der har fået tiltusket mig en Echo Dot :o) Og jeg er pænt glad for den.
Som I også beskriver kan den næsten alt, specielt med de mange Skills som andre har lavet (over 1200 and still growing).
Jeg har også fået hentet Amazon Alexa på mobilen, og kan sige at det fungerer perfekt (lige som web interfacet) med Android.

Spotify syntes jeg virker fint for mig, også til Danske kunstnere, de skal bare udtales lidt anderledes. F.eks Mads Langer udtales meget Amerikansket.
"Alexa, play Mads Laanger from playlist on Spotify". Den virker næsten hver gang. Ellers kan man lave playlister som er med Engelske navne.

Min plan er at integrere den med mit IHC anlæg via en Arduino wifi enhed, så den kan styre lyset og kontakter rundt i huset, samt med IR få kontrol over TV og forstærker.

Eneste hage ved at bruge den i Danmark, er at den ikke kan finde biografer, butikker og fortælle noget mere lokalt, da den rent geografisk tror den befinder sig i Tyskland. Og så selvfølgelig bestille ting på Amazon.

Men ellers virker alt andet, både "to do list" og shopping list, som er pænt rar at have når man er ude at handle. Det man mangler skrives blot på shopping listen med, "Alexa, add butter to my shopping list".
Eller "Alexa, add, clean car on Sunday, on my to do list".

OG ja jeg glæder mig også til at få en Google Home i hænderne. Så skulle vores Google Music virke, hvilket det ikke gør med Alexa. (med mindre man uploader hele herligheden igen til en Amazon konto)

Robert Winther

Den virker (naturligvis) fint med Google Music, YouTube, og vores Chromecasts, men også med Philips Hue. Funktionen med at tilføje ting til en indkøbseddel er også ret brugbar, selvom jeg skal tale engelsk til den.

Den har advaret mig om begrænset funktionalitet da den fandt ud af at den er i Danmark, men den giver mig da vejret og trafiksituationen (foreløbig dog desværre ikke på offentlig trafik), og herudover er det reelt mest danske navne der giver problemer, så der er et par playlister, Chromecasts og Hue-rum der har fået nye navne.

Jeg skal nok ha' mig en eller to mere, når de bliver tilgængelige i EU.

Log ind eller opret en konto for at skrive kommentarer

Pressemeddelelser

Silicom i Søborg har fået stærk vind i sejlene…

Silicom Denmark arbejder med cutting-edge teknologier og er helt fremme hvad angår FPGA teknologien, som har eksisteret i over 20 år.
22. sep 10:29

Conference: How AI and Machine Learning can accelerate your business growth

Can Artificial Intelligence (AI) and Machine Learning bring actual value to your business? Will it supercharge growth? How do other businesses leverage AI and Machine Learning?
13. sep 2017

Affecto has the solution and the tools you need

According to GDPR, you are required to be in control of all of your personally identifiable and sensitive data. There are only a few software tools on the market to support this requirement today.
13. sep 2017