Németh Géza, Olaszy Gábor, Bôhm Tamás, Ugron Zoltán
Szöveges adatbázis tervezése rendszerüzenet generátorhoz
Beszédválaszú telefonos alkalmazások elsôdleges kimenetei az elôre felvett beszédüzenetek (prompt-ok) – a rendszer ezeknek a bejátszásával ismerteti a felhasználóval a hívott szolgáltatással kapcsolatos választási lehetôségeit (menüpontok), visszaigazolja mûveleteit stb. A promptok szövegének alacsony entrópiája miatt valószínûsíthetô, hogy az emberi beszédet megközelítô minôségben elôállíthatóak egy erre a célra fejlesztett beszédszintetizátor segítségével. Ennek megvalósításával kiküszöbölhetôk az új üzenetek hangfelvételi nehézségei. A sikeres szintézishez szükséges, hogy a promptgenerátor adatbázisa reprezentatív legyen a várható bemeneti adatokra, azaz az elôállítandó promptokat minél kevesebb beszédelembôl tudja összefûzni. Cikkünkben a fejlesztés alatt álló rendszer mûködési elvének ismertetése után a hangadatbázis elkészítéséhez szükséges, felolvasandó szöveges állomány (szövegkorpusz) tervezési módszerét tárgyaljuk, majd bemutatjuk, hogyan vizsgáltuk meg a korpusz szövegének reprezentativitását egy független szöveggyûjtemény felhasználásával.