1. Načrtovanje govornega vmesnika : navodila za vajeAndrej Žgank, 2023, other educational material Keywords: telekomunikacije, govorni vmesniki, storitve, tonska izbira, avtomatsko razpoznavanje govora, avtomatska sinteza govora, navodila, vaje Published in DKUM: 27.11.2023; Views: 425; Downloads: 19
Full text (3,95 MB) |
2. Razvoj sistema za pretvorbo besedil v govor z globokimi nevronskimi mrežami : magistrsko deloMatevž Bratina, 2021, master's thesis Abstract: V magistrski nalogi smo razvili sistem pretvorbe besedila v govor PLATTOS za več jezikov. Sistem bazira na osnovi globokih nevronskih mrež. Osnovni cilj naloge je bil razviti in testirati sistem sinteze govora na osnovi globokega učenja, ki bo čim bolje generiral govor v več jezikih, pri čemer je tudi pomemben čas generiranja. Prvi del naloge tako predstavlja pregled tehnologij sistemov sinteze govora in njihova podrobnejša analiza. Zanimala nas je namreč arhitektura sistema sinteze govora, medsebojna primerjava zmogljivosti sistemov, njihov razvoj in kvaliteta sintetiziranega signala, ki ga določen TTS lahko generira. Sledila je izbira tehnologije globokega učenja, in razvoj novega TTS sistema. Izbrali smo tisto, ki je izkazovala največji potencial, da izpolni vse zastavljene cilje. Sledil je razvoj TTS sistema. Za prvo stopnjo (pretvorba vhodnega besedila v spektrogram) smo izbrali Tacotron globoki model. Ta je namenjen pretvorbi spektrogramov v pripadajoči govorni signal. V drugi stopnji, smo izbrali vokoder Waveglow. Pred izbiro komponent sistema, smo različne tipe vokoderjev in rekonstrukcijskih algoritmov tudi testirali. Sistem TTS na osnovi globokih nevronskih mrež PLATTOS smo testirali na različnih prosto dostopnih bazah govornih podatkov večih jezikov. Ocenjevali in primerjali smo tudi kvaliteto sinteze govora različnih arhitektur z globokimi nevronskimi mrežami. Kot kriterij kvalitete sinteze govora, smo bili predvsem pozorni na naravnost in razumljivost sintetiziranega govora. Pri ocenjevanju kvalitete smo tako uporabili subjektivne MUSHRA teste. Pokazalo se je, da kombinacija globokih nevronskih modelov Tacotron in Waveglow zagotovi najboljše rezultate v večih jezikih, kar se tiče kvalitete sintetiziranega govora in hitrosti generiranja odziva. Keywords: globoko učenje, nevronska mreža, sinteza govora, umetna inteligenca, Pytorch, Tensorflow, Tacotron, Waveglow, Wavenet, WaveRNN Published in DKUM: 18.10.2021; Views: 877; Downloads: 119
Full text (3,01 MB) |
3. |
4. |
5. Sistem za urejanje slovarja fonetičnih transkripcij : diplomska naloga univerzitetnega študijskega programaRamiz Derlić, 2001, undergraduate thesis Keywords: elektronika, sinteza govora, fonetična transkripcija, fonem, grafem, G/F pretvorba, SentAna, XGraPh, slovar fonetičnih transkripcij, slovenski jezik Published in DKUM: 26.07.2007; Views: 2757; Downloads: 0 |
6. |