Olaszy Gábor
A korpusz alapú beszédszintézis nyelvi, fonetikai kérdése
A beszédprodukció eredménye a beszéd hullámformája. Ez mindenkor egyedi és egyszeri produktum. A beszédszintézis által elôállított hullámforma és az emberi produktum közötti az alapvetô ellentmondás abban van, hogy a szintézisnél egy tárolt (fix) adatbázisból építjük fel a beszédjelet, tehát megsértjük az egyedi-egyszeri produkcióra vonatkozó tételt. A kérdés az, hogy hogyan lehet ezt az ellentmondást csökkenteni. A korpusz alapú szintézis elvébôl fakad, hogy az egyszeri jelzôre vonatkozó idôtényezôt próbálja tágítani azzal, hogy hosszabb elemekbôl építkezik mint a korábbi szintetizálási technológiák, noha itt is egy elôre meghatározott, tárolt beszédadatbázisból (korpusz) történik a szintetizált beszéd elôállítása. Ennek a törekvésnek a támogatására foglaltuk össze azokat a legalapvetôbb nyelvi, fonetikai ismereteket, amelyekkel segíteni lehet a legjobb jelöltek megtalálását a korpuszban és ezzel a minél jobb hangminôség elérését.