Híradástechnika

Vicsi Klára, Velkei Szabolcs, Szaszák György, Borostyán Gábor, Gordos Géza
Folyamatos, középszótáras, beszédfelismerô rendszer fejlesztési tapasztalatai: kórházi leletezô beszédfelismerô

A Beszédakusztikai Laboratóriumban kifejlesztésre került egy Windows XP alatt mûködô, statisztikai elvi alapokra épülô, folyamatos beszédfelismerô fejlesztôi környezet (MKBF 1.0), amely alkalmas különbözô középszótáras 1000-10.000 szavas szövegek betanítására és felismerésére. Új megoldásokat dolgoztunk ki az akusztikai elôfeldolgozásban, a statisztikai modellépítésben valamint fonetikai, fonológiai és morféma nyelvi szinteket vonunk be a felismerési folyamatba. A felismerô a statisztikai alapon mûködô HMM akusztikai fonémamodellekkel, valamint a statisztikai alapú bigram nyelvi modellekel mûködik, nem lineáris simítást használva. Vizsgálataink során változtattuk a betanító anyagokat és a szótárkészletet. Kétfajta bigram alappal dolgoztunk: elôször a hagyományos ragozott szóalakokból építettük fel a bigram mezôket, majd a szóalakokat morfémákra bontottuk, és ezekbôl a morfémákból építkeztünk. A cikkben a tesztelés eredményeirôl, a továbbfejlesztéshez nyert tapasztalatainkról számolunk be. A perplexitási vizsgálatok eredményeinek felhasználásával a felismerési biztonságot 70%-ról 91% fölé növeltük.

Toner Express