| | SLO | ENG | Piškotki in zasebnost

Večja pisava | Manjša pisava

Iskanje po katalogu digitalne knjižnice Pomoč

Iskalni niz: išči po
išči po
išči po
išči po
* po starem in bolonjskem študiju

Opcije:
  Ponastavi


1 - 4 / 4
Na začetekNa prejšnjo stran1Na naslednjo stranNa konec
1.
2.
Segmentacija in grozdenje govorcev za sisteme avtomatskega razpoznavanja spontanega govora
Matej Grašič, 2010, doktorska disertacija

Opis: V doktorski disertaciji obravnavamo problem segmentacije in grozdenja govorcev znotraj pogovornih, radijskih in televizijskih oddaj za sisteme avtomatskega razpoznavanja spontanega govora. Cilj predstavljene doktorske disertacije je definicija, implementacija in vrednotenje uspešnosti novega postopka za segmentacijo in grozdenje govorcev (diarizacijo govorcev). V okviru disertacije smo najprej realizirali referenčni online sistem za diarizacijo govorcev, ki temelji na postopku Bayesovega informacijskega kriterija (ang. »Bayesian Information Criterion« - BIC). Za referenčni sistem smo nato definirali akustične značilke z boljšo razločljivostjo govorcev v akustičnem prostoru. Nato smo dodali v postopek segmentacije statistični kriterij, kjer smo za normalizacijo rezultata kriterija uporabili univerzalni model govorca (ang. »Universal Background Model« - UBM). Ta postopek je predvsem uporaben v primerih, ko je akustične informacije znotraj segmentov premalo, da bi lahko zgradili popoln model govorca. V doktorski disertaciji smo vrednotili dva statistična kriterija in sicer razmerje križne verjetnosti (ang. »Cross Likelihood Ratio« - CLR) in normalizirano razmerje križne verjetnosti (ang. »Normalized Cross Likelihood Ratio« - NCLR). Oba kriterija izvirata s področja verifikacije govorcev, pri čemer je bila pokazana boljša uspešnost kriterija NCLR. V postopku segmentacije smo statistični kriterij uporabili kot dodatni pogoj, s katerim smo lahko izločili nepravilne prehode govorcev. Po določitvi najboljšega statističnega kriterija za področje segmentacije smo podoben pristop uporabili tudi za grozdenje. V primeru grozdenja smo kriterij BIC iz osnovnega sistema zamenjali s statističnim kriterijem za določitev grozdov. Pri tem smo vpeljali modeliranje govorca z več grozdi. Na tak način smo zajeli spreminjanje glasu govorca v posnetku. Na koncu smo optimirali celoten sistem z normalizacijo rezultata izbranega kriterija z referenčno vrednostjo kriterija; postopek je olajšal izbiro pragovne vrednosti ter izboljšal uspešnost. Prav tako smo izboljšali pravilno zaznavo kratkih segmentov govorca. To smo izvedli z adaptacijo statističnega kriterija glede na dolžino okna analize, kar je izboljšalo linearnost kriterija v primerih kratkega okna analize. V zadnji fazi smo izvedli končno ocenjevanje uspešnosti uporabljenih segmentacijskih algoritmov. Oceno uspešnosti predlaganega online sistema za diarizacijo govorcev smo izvedli na osnovi primerjave z osnovnim sistemom za diarizacijo govorcev, temelječim na postopku BIC. V drugi fazi smo primerjavo razširili na offline sisteme, kjer smo uporabili prosto dostopni offline diarizacijski sistem mClust . Za gradnjo univerzalnega modela splošnega govorca ter za določitev optimalnih vrednosti parametrov segmentacijskih postopkov smo uporabili učni del slovenske baze BNSI Broadcast News. Vrednotenje online in offline postopkov smo opravili na testnem delu slovenske in angleške govorne baze Broadcast News.
Ključne besede: segmentacija govorcev, grozdenje govorcev, online diarizacija govorcev, avtomatsko razpoznavanje spontanega govora, procesiranje govornega signala, akustične značilke, statistični kriteriji, razpoznavanje govorcev
Objavljeno: 01.07.2010; Ogledov: 2122; Prenosov: 153
.pdf Celotno besedilo (1,75 MB)

3.
Online speech/music segmentation based on the variance mean of filter bank energy
Marko Kos, Matej Grašič, Zdravko Kačič, 2009, izvirni znanstveni članek

Opis: This paper presents a novel feature for online speech/music segmentation basedon the variance mean of filter bank energy (VMFBE). The idea that encouraged the feature's construction is energy variation in a narrow frequency sub-band. The energy varies more rapidly, and to a greater extent for speech than for music. Therefore, an energy variance in such a sub-band isgreater for speech than for music. The radio broadcast database and the BNSIbroadcast news database were used for feature discrimination and segmentation ability evaluation. The calculation procedure of the VMFBE feature has 4 out of 6 steps in common with the MFCC feature calculation procedure. Therefore, it is a very convenient speech/music discriminator for use in real-time automatic speech recognition systems based on MFCC features, because valuable processing time can be saved, and computation load is only slightly increased. Analysis of the feature's speech/music discriminative ability shows an average error rate below 10% for radio broadcast material and it outperforms other features used for comparison, by more than 8%. The proposed feature as a stand-alone speech/music discriminator in a segmentation system achieves an overall accuracy of over 94% on radio broadcast material.
Ključne besede: online speech segmentation, algorithm, speech techniques
Objavljeno: 26.06.2017; Ogledov: 394; Prenosov: 180
.pdf Celotno besedilo (1,49 MB)
Gradivo ima več datotek! Več...

4.
Razvoj simulacijskega modela za potrebe odločanja poslovodstva pri spremembi plačnega sistema
Matej Grašič, 2016, magistrsko delo/naloga

Opis: V magistrskem delu obravnavamo spremembo plačnega sistema v večjih organizacijah kot kompleksen, dinamičen problem, saj je na eni strani opredeljena dinamika zaposlenih oz. prehodi med posameznimi razredi, ki so časovno pogojeni, na drugi strani pa finančni učinek spremembe plačnega sistema. Predstavljen je razvoj modela po principu sistemske dinamike in ob upoštevanju povratnih zank v kompleksnem organizacijskem sistemu. Razvoj modela je predstavljen po posameznih fazah, ki jih je potrebno pri spremembi ali uveljavitvi novega plačnega sistema obvezno upoštevati. Na razvitem modelu je bilo uporabljenih več različnih scenarijev, s katerimi smo pokazali vpliv izbrane strategije ter soodvisnost in medsebojni vpliv vseh drugih spremenljivk, ki vplivajo na končni rezultat. Za scenarije in simulacije so bili uporabljeni podatki iz konkretne organizacije s 1245 zaposlenimi. Razviti model omogoča poslovodstvu, da predvidi finančne učinke novega, spremenjenega plačnega sistema v prihodnosti in omogoči izbiro variante, ki zadosti vhodnim zahtevam, hkrati pa zagotavlja finančno vzdržnost v okvirnem obdobju prihodnjih 20 let
Ključne besede: plačni sistem, modeliranje, simulacija, povratna zanka, sistemska dinamika.
Objavljeno: 03.06.2016; Ogledov: 930; Prenosov: 63
.pdf Celotno besedilo (862,86 KB)

Iskanje izvedeno v 0.11 sek.
Na vrh
Logotipi partnerjev Univerza v Mariboru Univerza v Ljubljani Univerza na Primorskem Univerza v Novi Gorici