Szövegfelolvasó természetességének növelése
Csapó Tamás Gábor, Németh Géza, Fék Márk
{csapo, nemeth, fek}@tmit.bme.hu
BME Távközlési és Médiainformatikai Tanszék
Csapó Tamás Gábor, Németh Géza, Fék Márk
{csapo, nemeth, fek}@tmit.bme.hu
BME Távközlési és Médiainformatikai Tanszék
A cikk röviden bemutatja a jelenlegi beszédszintézis-rendszerekben alkalmazott prozódiai modelleket, illetve egyik gyengéjüket: az emberihez hasonló változatos prozódia modellezésének hiányát. Részletesen ismertetjük az általunk kidolgozott módszert a hosszabb időtartamú szintetizált beszéd monotonitásának csökkentésére. Egy természetes mondatokból álló beszédkorpuszt felhasználva, az alapfrekvencia-menet másolásával valósítottuk ezt meg. Végül bemutatjuk, hogyan történt a módszerünkkel előállított mondatok minőségének értékelése.