Normalt er 10-fingersystemet og lyden af det fulde danske alfabet banket ud gennem plasticknapper et fast element i hverdagen for sagsbehandlere i landets 98 kommuner. Men den ellers så velkendte tastaturlyd har i flere kommuner fået hård konkurrence.
Her eksperimenterer de med talegenkendelsesprogrammer, der gør det muligt for sagsbehandlerne med talte ord at indrapportere deres sager på computeren – på langt kortere tid, end de kan taste de samme sager ind.
Normalt sammenligner Danmark sig med de skandinaviske lande, når vi taler velfærdsteknologi. Og inden for talegenkendelse har Danmark, ifølge Børge Lindberg, professor i talegenkendelse ved Aalborg Universitet, lagt sig i spidsen af feltet:
»Vi er længere fremme med talegenkendelse i Danmark, hvor teknologien er til rådighed og bliver brugt. I Norge og Sverige er de først ved at indkøbe lignende løsninger,« siger han.
Det største forsøg i Europa foregår lige nu i Odense, hvor 700 sagsbehandlere bruger talegenkendelse som et fast element i deres hverdag. Hvis anvendelsen fortsætter i samme opadgående retning som nu, vil hver sagsbehandler i kommunens jobcenter kunne spare otte timer om måneden. Næste år vil over 1.400 sagsbehandlere, som bruger mere end halvanden time dagligt på at skrive journal, anvende teknologien.
Sparer både tid og penge
Erfaringsgrundlaget er allerede nu så stort, at man kan udpege de præcise arbejdsområder, hvor talegenkendelse nu og i fremtiden vil betyde en kæmpe tidsbesparelse og i sidste ende også en økonomisk besparelse.
Især i kommunens jobcenter og borgerservice, hvor sagerne i høj grad er standardiserede, har de kunnet mærke en stor aflastning, fortæller digitaliseringschef Allan Schiellerup Bager:
»Erfaringerne fra Jobcentret og Borgerservice beviser, at talegenkendelse helt klart har sin berettigelse. Her viser vores statistik, at medarbejderne på ganske kort tid har nået en tidsbesparelse på 50 procent, hvis de eksempelvis skriver tre timer om dagen. Derfor tror vi på den her teknologi,« siger han.
Tre andre danske kommuner har lignende projekter kørende, og her er erfaringerne de samme: Hvis man bruger standardvendinger og -ord, giver talegenkendelse et godt afkast.
I alt arbejder der omkring 4.500 sagsbehandlere på jobcentrene i Danmark, så en månedlig besparelse på otte timer pr. medarbejder vil alene her kunne frigive, hvad der svarer til næsten 250 fuldtidsmedarbejdere fra den administrative del af sagsbehandlingen.
Talegenkendelsesprogrammet har omvendt vist sig at have problemer i afdelinger, hvor sagerne indeholder både standardfraser og teknisk sprog, eksempelvis i økonomiforvaltningen. En særskilt sprogmodel, hvor ordbogen er optimeret til økonomihåndtering, kan være en løsning på det problem, mener Børge Lindberg.
Langsom indlæring
Mens talegenkendelse er effektivt, når systemet kører, har programmets ‘læretid’ dog vist sig længere end ventet. Og det betyder, at Odense Kommunes forventning om med projektet at spare 78 millioner kroner frem mod 2015 ikke bliver opfyldt:
»Vores erfaringer viser, at det tager tre gange længere tid end forventet at lære programmet ens stemme at kende. Med den kendsgerning in mente må vi sige, at de beregnede besparelser ikke bliver nået inden for de tre år, vi har afsat,« siger Allan Schiellerup Bager.
En måde at oplære systemet på er, at den enkelte sagsbehandler fysisk retter ord til, som programmet ikke forstår, hvorefter programmet lagrer ordet og dets betydning.
Men for at fremskynde oplæringen af systemet har Odense Kommune lavet et udtræk fra det system, kommunen bruger til elektronisk håndtering af sine sager og dokumenter - det har givet et tilskud til ordbogen på intet mindre end 100 millioner ord, vendinger, endelser og lignende.
Disse data vil blive overført til det østrigsk ejede Nuance, som står for at udvikle programmet, der sælges af IBM i Danmark. På den måde bliver kommunen en stor bidragyder i forhold til at tage talegenkendelse et teknologisk skridt videre, mener projektleder i Odense Kommune Carl Østergaard.
»Og som en af de største testplatforme for talegenkendelse er vi selvfølgelig interesserede i at gøre systemet hurtigere,« siger han.
Brug det de rette steder
Der er dog arbejdsfunktioner, hvor tastaturet fortsat vil være en nødvendig samarbejdspartner. Det gælder f.eks. for mellemledere, der bevæger sig mellem mange forskellige arbejdsområder.
Derfor skal både kommunerne og alle andre institutioner, som i fremtiden vil skifte tastaturet ud med talegenkendelse, være meget bevidste om at koncentrere brugen de rette steder, påpeger Børge Lindberg.
»Jeg tror på, at talegenkendelse har et stort fremtidspotentiale. Men kommunerne skal anerkende begrænsningerne. Så de er nødt til at tale nogenlunde klart og ikke benytte systemet på en lang række arbejdsområder, hvis det økonomisk og tidsmæssigt skal give gevinst,« siger han.
For Jette Voigt Jensen, der arbejder i Borgerservice i Odense Kommune, er det dog svært at se begrænsningerne i talegenkendelse. Hun er lam i højre side, og programmet til talegenkendelse har gjort, at hun ved journalskrivning i dag er lige så hurtig som sine kolleger.
»Jeg er utrolig glad for systemet, som har aflastet mig enormt. Tidligere havde jeg store smerter efter en arbejdsdag, men nu kan jeg klare langt mere,« fortæller hun.
Tre trin til talegenkendelse
De talte ord skal indfanges. Erfaringerne fra Odense Kommune viser, at det gøres bedst med et ganske almindeligt headset, som man taler ind i.
Ved hjælp af en stor matematisk beregning, der kræver en vis computerkraft, skal programmet gennem fonologi og skjulte Markov-modeller for fonemerne genkende de danske sproglyde. Fonologien kan fortælle, hvordan ordet ‘mig’ bliver udtalt. I’et bliver på dansk udtalt snarere som et a, og det er her fonologien kan bruges.
I sidste led udnytter talegenkenderen også sprogmodellen. På baggrund af de skjulte Markov-modellers sandsynligheder og sprogmodellens sandsynligheder findes den ordsekvens, som talegenkenderen tror mest på.