Teknologispring fra Google: 16.000 samples per sekund skaber unik kunstig menneskestemme

Kunstig intelligens sikrer nu, at computergenererede stemmer lyder som menneskets - inklusive betoning og følelser.

Et teknologispring er ved at indfinde sig i forhold til at få computere til at lyde som mennesker - og altså ikke som f.eks. Stephen Hawking lyder..

Det er Googles forsknings- og udviklingsvirksomhed, DeepMind, som arbejder med intelligent software og kunstig intelligens, som forventer dette inden for området computergenereret tale, skriver nyhedsmediet CNBC og herhjemme finans.dk.

Indtil videre bliver computertale genereret ved at kæde mange stumper optaget lyd fra et menneske sammen til en kæde af ord. Det kaldes text-to-speech - en teknologi, som kom frem i slutningen af 1960'erne, hvor den første maskine, der kunne tale engelske ord, blev udviklet i Japan.

Det virker, men det gør det meget svært f.eks. at lægge betoning og dermed følelser på ord, uanset hvor mange tusinder og atter tusinder af talestumper computeren lægger sammen.

Og lige præcis det - at give computertale følelser - er noget, Deepmind meget gerne vil. Målet er en meningsfuld samtale med computere:

»At give folk mulighed for at konversere med maskiner er en mangeårig drøm om menneske-computer-interaktion,« lød det torsdag fra Deepmind, hvor virksomheden løftede sløret for, at dens nye teknologi netop muliggør det.

Modellering af lyd

Den nye nye teknologi kaldes WaveNet og fungerer ved at modellere rå lyd med neurale netværk - kunstig intelligens, som forsøger at simulere menneskets.

For at modellere kurverne anvender DeepMind 16.000 samples per sekund, når data skal genereres.

Teknologien kan i princippet kopiere en hvilken som helst stemme og tillægge denne både følelser og accenter.

På dette link er der eksempler på forskellige computergenererede stemmer og dermed forskellen på den nye og ældre teknologi.

Deepmind har desuden ladet Wavenets neurale netværk står for komponeringen af musik, og hjemmesiden giver dig således også eksempler på musik komponeret udelukkende af kunstig intelligens.

Nyheden kommer blot få måneder efter, at Deepmind blev verdenskendt med deres kunstige intelligens AlphaGo, som blev verdens første software til at slå et menneske i det uhyre komplicerede spil Go.

Tips og korrekturforslag til denne historie sendes til tip@version2.dk
Følg forløbet
Kommentarer (4)
sortSortér kommentarer
  • Ældste først
  • Nyeste først
  • Bedste først
Andy Fischer

Hvad bliver mon det næste? Tænk hvis jeg skal opleve 48 kHz, eller måske ligefrem astronomiske 96 kHz i min levetid ;-) Jeg tror måske de skulle have brugt et enkelt afsnit på at forklare læseren præcis hvorfor 16 kHz er så fantastisk i denne sammenhæng.

  • 1
  • 0
Log ind eller Opret konto for at kommentere