| | SLO | ENG | Piškotki in zasebnost

Večja pisava | Manjša pisava

Iskanje po katalogu digitalne knjižnice Pomoč

Iskalni niz: išči po
išči po
išči po
išči po
* po starem in bolonjskem študiju

Opcije:
  Ponastavi


1 - 5 / 5
Na začetekNa prejšnjo stran1Na naslednjo stranNa konec
1.
Razvoj sistema za pretvorbo besedil v govor z globokimi nevronskimi mrežami : magistrsko delo
Matevž Bratina, 2021, magistrsko delo

Opis: V magistrski nalogi smo razvili sistem pretvorbe besedila v govor PLATTOS za več jezikov. Sistem bazira na osnovi globokih nevronskih mrež. Osnovni cilj naloge je bil razviti in testirati sistem sinteze govora na osnovi globokega učenja, ki bo čim bolje generiral govor v več jezikih, pri čemer je tudi pomemben čas generiranja. Prvi del naloge tako predstavlja pregled tehnologij sistemov sinteze govora in njihova podrobnejša analiza. Zanimala nas je namreč arhitektura sistema sinteze govora, medsebojna primerjava zmogljivosti sistemov, njihov razvoj in kvaliteta sintetiziranega signala, ki ga določen TTS lahko generira. Sledila je izbira tehnologije globokega učenja, in razvoj novega TTS sistema. Izbrali smo tisto, ki je izkazovala največji potencial, da izpolni vse zastavljene cilje. Sledil je razvoj TTS sistema. Za prvo stopnjo (pretvorba vhodnega besedila v spektrogram) smo izbrali Tacotron globoki model. Ta je namenjen pretvorbi spektrogramov v pripadajoči govorni signal. V drugi stopnji, smo izbrali vokoder Waveglow. Pred izbiro komponent sistema, smo različne tipe vokoderjev in rekonstrukcijskih algoritmov tudi testirali. Sistem TTS na osnovi globokih nevronskih mrež PLATTOS smo testirali na različnih prosto dostopnih bazah govornih podatkov večih jezikov. Ocenjevali in primerjali smo tudi kvaliteto sinteze govora različnih arhitektur z globokimi nevronskimi mrežami. Kot kriterij kvalitete sinteze govora, smo bili predvsem pozorni na naravnost in razumljivost sintetiziranega govora. Pri ocenjevanju kvalitete smo tako uporabili subjektivne MUSHRA teste. Pokazalo se je, da kombinacija globokih nevronskih modelov Tacotron in Waveglow zagotovi najboljše rezultate v večih jezikih, kar se tiče kvalitete sintetiziranega govora in hitrosti generiranja odziva.
Ključne besede: globoko učenje, nevronska mreža, sinteza govora, umetna inteligenca, Pytorch, Tensorflow, Tacotron, Waveglow, Wavenet, WaveRNN
Objavljeno v DKUM: 18.10.2021; Ogledov: 218; Prenosov: 38
.pdf Celotno besedilo (3,01 MB)

2.
3.
4.
5.
Iskanje izvedeno v 0.1 sek.
Na vrh
Logotipi partnerjev Univerza v Mariboru Univerza v Ljubljani Univerza na Primorskem Univerza v Novi Gorici