Mozilla frigiver 500 timers crowdsourcede optagelser til udvikling af talegenkendelse

Illustration: Mozilla
Mozilla giver offentligheden adgang til de hidtil indsamlede taleoptagelser i deres 'Project Common Voice'.

Mozilla har lagt 500 timers taleoptagelser op til fri download som en del af deres projekt "Common Voice", der skal bidrage til udviklingen af talegenkendelsesprogrammer, skriver The Register.

I juli bad Mozilla frivillige sende dem taleoptagelser, og datasættet indeholder nu 400.000 optagelser fra 20.000 mennesker.

Projektet er stadig langt fra målet, der lyder på 10.000 timers optagelser, og man kan stadig bidrage enten med optagelser eller bedømmelser af, hvordan softwaren genkender andres tale.

De sætninger som Mozilla beder frivillige læse op, er indtil videre engelske, men Mozilla forventer at udvide projektet til andre sprog i første halvdel af 2018.

“De fleste af os har kun adgang til en forholdsvis begrænset samling af stemme data, som er en essentiel betingelse for at skabe talegenkendelsesmaskiner i høj kvalitet," skriver Michael Henretty, der arbejder med projektet.

Datasættet og fire andre af slagsen kan downloades på dette link.

Tips og korrekturforslag til denne historie sendes til tip@version2.dk
Kommentarer (0)
sortSortér kommentarer
  • Ældste først
  • Nyeste først
  • Bedste først
Log ind eller Opret konto for at kommentere