Szolgáltatás-automatizálás és beszédtechnológia
Ebben a számban azt kívánjuk bemutatni, hogy a beszédtechnológia eredményei hogyan jelennek meg az infokommunikációs szolgáltatások palettájának bővítésében és azok minőségének javításában.
Elsőként egy áttekintő jellegű cikket olvashatunk a beszédtechnológiai alkalmazások gyors és hatékony fejlesztését támogató jelölőnyelvekről.
Az ezt követő blokkban a végfelhasználók számára remélhetőleg rövid időn belül elérhető szolgáltatásokat tárgyaló cikkek találhatók. A gyógyszerek felhasználói utasítását teljesen automatizáltan – specializált beszédfelismerő és szövegfelolvasó felhasználásával – elérhetővé tevő rendszer ismertetése jó példa arra, hogy a mégoly triviálisnak tűnő emberi funkciók sikeres gépi megoldásához is milyen sokrétű elemző és alkotó munka szükséges. Egy másik új fejlesztés az orvosok munkájának hatékonyságát javíthatja. A bemondás alapján az írott leletet automatikusan elkészítő rendszer bemutatása jól jelzi a formalizált és a természetes kommunikáció eltéréséből adódó nehézségeket. A szövegfelolvasó rendszerek fejlődését szemlélteti az időjárás-jelentések témakörén keresztül egy kiemelkedően alapos teszteléssel alátámasztott cikk. Szellemes és újszerű ötlet az akusztikus jelből a szájmozgás vizuális paramétereit közvetlenül meghatározó eljárás, ami nagy segítséget jelenthet egészséges és siket emberek közvetlen kapcsolatteremtésében.
A záró blokkban a különböző beszédtechnológiai alkalmazások kifejlesztéséhez szükséges technológiai elemekről és háttér-megoldásokról olvashatunk. Bemutatásra kerülnek azok a nyelvstatisztikai és elemzési szempontok és módszerek, melyek felhasználásával olyan szövegtörzs alakítható ki, melynek felolvasása és feldolgozása után az adott témakörre az emberi minőséget megközelítő gépi felolvasás állítható elő. Az interdiszciplináris megközelítés szükségességét és jelentőségét jól illusztrálja a korpusz alapú beszédszintézis nyelvészeti és fonetikai kérdéseit ismertető írás. A szövegfelolvasó rendszerek a szöveg előfeldolgozását valós időben végző modulok nélkül gyakorlati alkalmazásokba nehezen helyezhetők. Ilyen probléma például a szöveg nyelvének megállapítása vagy a szófajok meghatározása. Egy erre a témakörre kifejlesztett gépi tanuló algoritmust is ismertetünk. A számot egy klasszikus témakör – a beszéd detektálása, egyéb jelektől és szünettől való megkülönböztetése – újszerű, a témakör ETSI szabványánál jobb eredményeket elérő megközelítésről szóló beszámoló zárja.
Németh Géza Szabó Csaba
szerkesztő főszerkesztő