Eestikeelset korpuspõhist kõnesünteesi on arendatud riiklike programmide projektide
"Eestikeelne korpuspõhine kõnesüntees" ja "Kõnesünteesiliidesed" raames.
Kui difoonide andmebaasil
põhineval sünteesil vastab igale võimalikule häälikult-häälikule üleminekule täpselt üks difoon, siis korpuspõhisel
sünteesil on kogu kõnekorpus sünteesi akustiliseks baasiks.
Korpuspõhise sünteesi eelduseks on:
- foneetiliselt rikas tekstikorpus;
- kõnekorpuse salvestamine keelejuhtide esituses;
- häälikusüsteemi fikseerimine ja tunnuste valik;
- kõnekorpuse märgendamine ja segmenteerimine.
Üksuste valikul põhinev süntees (Festival)
Kasutame Festival arendussüsteemi ja sünteesimootorit. Teksti lingvistiline töötlus sisaldab täht-häälik teisendust, mittesõnade interpretaatorit ja sõnade morfoloogilist analüüsi. Sobivate kõneüksuste valik on korpussünteesi kõige tähtsam osa.
Eelistatakse võimalikult pikki kõnestringe ning optimeeritakse kõneüksuste lingvistilisi ja füüsikalisi parameetreid erinevate sobivuskriteeriumide alusel.
Üksuste valikul põhineva kõnesünteesi eeliseks on väljundkõne kõrge segmentaalne kvaliteet ja loomulik kõla. Puuduseks on eelkõige see, et sünteesil on vajalikud mahukad kõnekorpused ja sünteesiprotsessi parameetrid pole reaalajas juhitavad.
HTS-kõnesüntees
Peidetud Markovi mudelitel HMM põhineval statistilis-parameetrilisel kõnesünteesil treenitakse eelnevalt kõneproduktsiooni mudeleid kõnekorpustel.
Ehkki süntesaatori väljundkõnelaine segmentaalne kvaliteet pole nii hea kui üksuste valikul põhineval sünteesil on HTS-sünteesil ka mitu eelist.
Esiteks on sünteesitav väljundkõne ladus ja sorav. Teiseks on sünteesiprotsess reaaalajas juhitav, võimalik on muuta kõnetempot, häälekõrgust ja -tämbrit.
Kolmandaks on sünteesimootor küllaltki kompaktne, peale treenimisprotsessi ei vaja sünteesimootor enam suuri kõnekorpusi.
Korpuspõhise kõnesünteesi projektide raames loodud ressurssidest ja
väljatöötatud sünteesimoodulitest on kättesaadavad:
- Korpuspõhise kõnesünteesi jaoks koostatud erinevad tekstikorpused: 697 ja 3350 lauset.
- Kõnekorpused neljale keelejuhile (50-320 minutit kõnet)
- Eestikeelsete elektrooniliste teabetekstide ettelugemise süsteem nägemispuudega inimestele
- Suurtel kõnekorpustel põhinevad ja erinavatel meetoditel genereeritud sünteeshäälte näited
- Allalaaditavad korpuspõhised üksuste valikul põhinevad sünteeshääled
festvox_eki_et_liisi_cg.tar.gz (5,7 MB)
festvox_eki_et_riina_clunits.tar.gz (100,2MB)
|