| | SLO | ENG | Cookies and privacy

Bigger font | Smaller font

Search the digital library catalog Help

Query: search in
search in
search in
search in
* old and bologna study programme

Options:
  Reset


1 - 10 / 33
First pagePrevious page1234Next pageLast page
1.
Vpliv napak razpoznavalnika govora na kakovost strojnih prevodov v sistemih prevajanja govora v govor : magistrsko delo
Klemen Stanič, 2025, master's thesis

Abstract: Magistrsko delo analizira vpliv napak avtomatskega razpoznavalnika govora na kakovost strojnih prevodov v sistemih prevajanja govora v govor. S prevajalnikom smo prevedli več izhodov razpoznavalnika govora, ki so se med seboj razlikovali v kvaliteti razpoznavanja, kot referenčne prevode pa smo vzeli prevod nabora povedi, ki je bil uporabljen na vhodu v razpoznavalnik. Tipi napak, ki smo jih obravnavali, so bili: vstavljanje, brisanje in zamenjava besede. V nadaljevanju smo jih še podrobneje razdelali glede na besedne vrste in obseg spremembe. Vpliv napak na kakovost prevodov smo ocenjevali z metriko BLEU. Ugotovili smo, da določene vrste napak bolj vplivajo na kakovost prevoda kakor druge.
Keywords: razpoznavanje govora, strojno prevajanje, napaka razpoznavalnika, nevronske mreže, BLEU
Published in DKUM: 31.03.2025; Views: 0; Downloads: 19
.pdf Full text (2,35 MB)

2.
3.
Razvoj in implementacija sistema nagrajevanja za opravljeno delo v intralogističnem sistemu : magistrsko delo
Matija Hojsak, 2023, master's thesis

Abstract: Magistrska naloga obravnava razvoj in implementacijo sistema nagrajevanja v logističnem okolju. Najprej predstavimo teoretično ozadje razpoznavanja govora in osnovne komponente sistema za razpoznavanje govora. Sledi pregled najnovejših trendov v intralogistiki s poudarkom na digitalizaciji. Opisana je integracija razpoznavalnika govora v intralogistične procese. V drugem delu magistrske naloge predstavimo uporabljene tehnologije, ki so osnova za implementacijo sistema nagrajevanja, ki ga v nadaljevanju tudi podrobno opišemo. Rešitev je prilagojena željam strank in se osredotoča na preglednost, prilagodljivost ter pripravljenost za prihodnje razširitve.
Keywords: razpoznavanje govora, intralogistika, nagrajevanje, Java, Lydia
Published in DKUM: 23.11.2023; Views: 386; Downloads: 0

4.
Razpoznavanje govora iz zvočnega posnetka z glasbenim ozadjem : diplomsko delo
Nejc Forstnerič, 2023, undergraduate thesis

Abstract: Diplomsko delo obravnava, kako nivo jakosti zvočnega oziroma glasbenega ozadja v multimedijskih izdelkih, kot so samostojni zvočni posnetki, zvok v videu ali filmu, vpliva na razpoznavanje govorjene besede. Analiziramo pomen izgube sluha v povezavi z razumevanjem govora. Izvedeno je bilo testiranje razpoznavanja besed pri različnih nivojih jakosti zvočni ozadij, ocenjena je bila zahtevnost poslušanja in podatki so bili analizirani. Pri tem so bila uporabljena različna zvočna ozadja.
Keywords: razpoznavanje govora, zvočno ozadje, nivo jakosti, zahtevnost poslušanja
Published in DKUM: 21.09.2023; Views: 407; Downloads: 52
.pdf Full text (2,60 MB)

5.
Zasnova invalidskega vozička kot kiberfizičnega sistema in analiza vpliva uporabe na organizacijo rehabilitacijskega procesa
Andrej Koložvari, 2020, doctoral dissertation

Abstract: V tem delu je opredeljena možnost razvoja invalidskega vozička kot kiberfizičnega sistema, ki je v tesni povezavi z internetom in njegovimi uporabniki. Definirana je struktura kiberfizičnega sistema s ključnimi povratnimi zankami, ki omogočajo upravljanje vozička s pomočjo govora. Preučena je možnost uporabe v rehabilitacijskih procesih ob višji stopnji avtonomnosti bolnikov. Izvedena je bila analiza ročno upravljanega invalidskega vozička kot izhodišče za razvoj prototipov govorno upravljanega vozička. Opredeljen je bil prototipni pristop k razvoju kiberfizičnega vozička, ki je potekal v več fazah. Razvitih je bilo več manjših prototipov in dva prototipa realne velikosti. Opisan je razvoj manjših prototipov kakor tudi prenos funkcionalnosti na dva prototipa realne velikosti. Podana je zasnova govorno upravljanega kiberfizičnega sistema invalidskega vozička za ljudi s posebnimi potrebami. Razviti sta bili dve rešitvi v obliki prototipa realne velikosti. Prvi prototip realne velikosti za razpoznavo govora izkorišča le en oblačni informacijski sistem za razpoznavo govora, hkrati pa vključuje le osnovna tipala za pomoč pri navigaciji. Drugi prototip realne velikosti ima vključena dva oblačna informacijska sistema za razpoznavo govora ter več tipal, ki zagotavljajo določeno stopnjo avtonomnosti vozička. Opisan je programski sveženj, ki je omogočil realizacijo sistema in prenos sporočil med klientom, strežnikom in oblačnim informacijskim sistemom. Prav tako je podrobno opisan sveženj strojne opreme, ki omogoča hiter prototipni razvoj in enostavno povezljivost z informacijskim oblakom. Uporabniški vmesnik sistema omogoča govorni vhod in nadzor s pomočjo spletne kamere. Sistem je zasnovan tako, da je omogočeno oddaljeno posodabljanje programske opreme. Na prototipih realne velikosti je bila izvedena analiza natančnosti izvedbe izrečenih ukazov s pomočjo testnih subjektov v laboratorijskem in kliničnem okolju. Prav tako je bila izvedena meritev zakasnitev, kjer se je izkazalo, da je opredeljeni koncept primeren za govorno upravljanje v realnem času. Z namenom večje natančnosti razpoznave govora je bil razvit in uporabljen princip vzporedne oblačne žetve informacijskih sistemov. Za izboljšanje govornega upravljanja je bil definiran vnaprej določen osnovni nabor ukazov. Opredeljeno je oblikovanje tabele zamenjav končnih razpoznanih besed in vmesnih rezultatov razpoznave. Definiran je pogoj parne disjunktnosti elementov množic, ki opredelijo izvedbo posameznega ukaza, ter algoritem združevanja rezultatov več oblačnih sistemov za razpoznavanje govora. Opredeljeni sta izvedljivost uporabe algoritmov za žetev govorne razpoznave v informacijskem oblaku ter teoretična meja natančnosti razpoznave ob podanih pogojih. Uporabnost razvitega kiberfizičnega vozička z možnostjo govornega upravljanja je bila preizkušena v kliničnem okolju. Opredeljen je vpliv na rehabilitacijske procese ob povečanju avtonomije bolnika ter možnosti oddaljenega spremljanja fizioloških parametrov. Z namenom primerjave rezultatov testiranja različnih uporabnikov je bil oblikovan testni poligon za preizkušanje funkcionalnosti. Ob izvedenih preizkusih so bile ugotovljene statistično pomembne razlike v natančnosti izvedbe govornih ukazov, ki so potrdile učinkovitost razvitega algoritma združevanja razpoznav in teoretične predpostavke o možnosti povečanja stopnje natančnosti pri izvedbi govornih ukazov. V sklepnem delu so podana izhodišča za nadaljnje delo predvsem v smislu združevanja več oblačnih informacijskih sistemov za razpoznavo govora in rešitev s področja robnega računalništva.
Keywords: kiberfizični sistemi, organizacija rehabilitacijskega procesa, invalidski voziček, razpoznavanje govora, žetev oblačnih informacijskih sistemov
Published in DKUM: 12.03.2021; Views: 1407; Downloads: 107
.pdf Full text (4,80 MB)

6.
7.
8.
Slovenska baza BNSI broadcast news za razpoznavanje tekočega govora
Andrej Žgank, Darinka Verdonik, Zdravko Kačič, 2008, original scientific article

Abstract: V članku bomo predstavili nov slovenski jezikovni vir, bazo BNSI Broadcast News, ki vsebuje posnetke televizijskih dnevnoinformativnih oddaj. Vir je namenjen razvoju razpoznavalnikov tekočega govora z velikim slovarjem besed za neomejeno domeno. Sestavljajo ga govorna baza z ročno tvorjenimi transkripcijami v obsegu 36 ur in tekstovni korpus, ki vsebuje I I niio besed. Govorna baza je namenjena učenju akustičnih modelov, tekstovni korpus pa bo uporabljen za izdelavo jezikovnih modelov. Novi jezikovni vir je plod sodelovanja med Univerzo v Mariboru, FERI in IZ'FV Slovenija. V članku bomo najprej predstavili postopek zajemanja gradiva in karakteristike baze. Opisali bomo potek ročnega zapisovanja govornega korpusa. Sledila bo podrobna analiza govornega in tekstovnega dela baze, ki je namenjena predstavitvi vseh lastnosti jezikovnega vira, ki vplivajo na razvoj razpoznavalnikov govora.
Keywords: slovenski jezikovni vir, avtomatsko razpoznavanje tekočega govora, govorni korpus, besedilni korpus, Broadcast news
Published in DKUM: 10.07.2015; Views: 1433; Downloads: 70
URL Link to full text

9.
AVTOMATSKO RAZPOZNAVANJE GOVORA ZA PREGIBNI JEZIK Z UPORABO MORFOLOŠKIH JEZIKOVNIH MODELOV S KONTEKSTNO ODVISNO STRUKTURO
Gregor Donaj, 2015, doctoral dissertation

Abstract: V nalogi smo se posvetili jezikovnemu modeliranju za avtomatsko razpoznavanje govora z velikim slovarjem besed. Pri takšnem razpoznavanju je še vedno velika težava pravilnost razpoznavanja izgovorjenih besed. Ta je še posebej izrazita pri morfološko kompleksnejših jezikih, kot je slovenščina. Za delovanje sistema razpoznavanja tekočega govora potrebujemo jezikovne modele. Da lahko zgradimo primeren jezikovni model, potrebujemo ustrezno velike učne množice podatkov, ki morajo pri morfološko kompleksnejših jezikih biti še večje. Sodobni razpoznavalniki govora za slovenščino delajo več napak kot razpoznavalniki za druge jezike. Pogost problem so napačno razpoznane končnice besed. To kaže, da je smiselno razmišljati o vključevanju oblikoskladenjskih informacij v jezikovno modeliranje, če hočemo zmanjšati število napak. V doktorski nalogi predstavljamo zasnovo sistema, ki ob običajnih n-gramskih besednih jezikovnih modelih uporablja tudi modele, ki vključujejo informacije o besedni vrsti in slovničnih kategorijah prepoznanih besed. Imenujemo jih morfološki modeli. Razvili smo algoritem, ki na osnovi rezultatov perpleksnosti na razvojni množici določa najprimernejšo strukturo takšnih modelov glede na besedne vrste konteksta besede, ki jo ocenjujemo. Pravimo, da imajo modeli kontekstno odvisno strukturo. Implementirali smo jih kot faktorizirane jezikovne modele. V teh modelih se soočamo z veliko množico različnih možnih kontekstov besede in za vsak kontekst gradimo strukturo modelov ločeno. Pri tem lahko uporabimo le majhen del učne množice. Zato prihaja tudi tukaj do pomanjkanja učnih podatkov, kljub temu da imamo manjše zahteve po velikosti učne množice. Zato smo razvili pristope združevanja različnih kontekstov. Zaradi velikega števila možnih kontekstov in veliko različnih možnosti struktur modelov smo razvili tudi pristope za omejeno iskanje možnih struktur modelov na podlagi postopne gradnje njihovih struktur in sprotnega ocenjevanja. Sistem razpoznavanja je zasnovan v obliki dvoprehodnega algoritma, kjer v drugem prehodu uporabljamo v okviru doktorske disertacije razvite modele. Razvili smo tudi postopek za hitro optimizacijo uteži modelov in postopek dinamičnega uteževanja glede na kontekst besede. Uspešnost razpoznavanja z razvitimi modeli in brez njih smo testirali na slovenski govorni bazi Broadcast News.
Keywords: avtomatsko razpoznavanje govora z velikim slovarjem, jezikovno modeliranje, faktorizirani jezikovni modeli, perpleksnost, oblikoskladenjske oznake, dvoprehodni iskalni algoritmi
Published in DKUM: 18.05.2015; Views: 2286; Downloads: 190
.pdf Full text (3,68 MB)

10.
GOVORNE TEHNOLOGIJE V RAČUNALNIŠKIH IGRAH
Simon Furman, 2014, undergraduate thesis

Abstract: V diplomskem delu opisujemo načine za razpoznavanje govora, računalniško generiranje govora in identifikacijo govorca ter ogrodje za izdelavo računalniške igre. Na podlagi teh znanj smo razvili 3D računalniško igro, ki jo lahko med igranjem upravljamo preko tipkovnice ali govora. Gre za namizno aplikacijo, ki je namenjena uporabnikom operacijskega sistema Windows. Napisana je v programskem jeziku C# in v ogrodju XNA, ki omogoča razvoj in upravljanje iger.
Keywords: razpoznavanje govora, računalniško generiranje govora, identifikacija govorca, uporabniški vmesnik, računalniška igra, XNA
Published in DKUM: 06.03.2015; Views: 1846; Downloads: 175
.pdf Full text (1,02 MB)

Search done in 0.2 sec.
Back to top
Logos of partners University of Maribor University of Ljubljana University of Primorska University of Nova Gorica