Microsoft sætter rekord i talegenkendelse

tale, hviske, ord, speech recognition
Microsofts engelske talegenkendelses-AI har rekordlav fejlprocent.

Microsoft har lagt sig i førertrøjen i kampen med Google og IBM om at udvikle den bedste talegenkendelses AI.

De præsenterede nemlig en fejlprocent på 5,1 procent i Switchboard-testen i søndags. Den test går ud på at transskribere forskellige telefonsamtaler mellem fremmede mennesker om alt fra sport til politik og er blevet brugt som benchmark inden for feltet i 20 år.

Microsoft rammer dermed den fejlprocent, som IBM mener man kan forvente, når en person transskriberer.

Deep-learning driver feltet fremad

Microsoft krediterer deres succes til deres egen deep learning software, Microsoft Cognition Toolkit, der er brugt til at optimere både systemets arkitektur og hyperparametre. Det hele er drevet af Azure’s GPU cloud.

Google bruger også machine learning til at optimere sin talegenkendelses-artkitektur. Firmaet præsenterede i maj en fejlmargin på 4,9 procent, men har ikke offentliggjort, hvilken test det anvender. IBM præsenterede i marts en fejlprocent på 5,5 procent.

Hvis du vil læse mere om Microsofts arbejde med talegenkendelse, har de udgivet et research paper i forbindelse med annonceringen her.

Tips og korrekturforslag til denne historie sendes til tip@version2.dk

Følg forløbet

Kommentarer (3)

Kommentarer (3)
Jan Gundtofte-Bruun

Kan ma kende forskel på "How to recognize speech" eller "How to wreck a nice beach"?

Kan man forstå de forskellige betydninger af ordene i "Time flies like an arrow, but fruit flies like a banana" ?

Log ind eller opret en konto for at skrive kommentarer

Pressemeddelelser

Conference: How AI and Machine Learning can accelerate your business growth

Can Artificial Intelligence (AI) and Machine Learning bring actual value to your business? Will it supercharge growth? How do other businesses leverage AI and Machine Learning?
13. sep 2017

Affecto has the solution and the tools you need

According to GDPR, you are required to be in control of all of your personally identifiable and sensitive data. There are only a few software tools on the market to support this requirement today.
13. sep 2017

Xena - an innovative force in testing next-generation communications technology

22. aug 2017