| | SLO | ENG | Cookies and privacy

Bigger font | Smaller font

Search the digital library catalog Help

Query: search in
search in
search in
search in
* old and bologna study programme

Options:
  Reset


71 - 80 / 98
First pagePrevious page12345678910Next pageLast page
71.
RAZPOZNAVANJE OBRAZOV IN OČI V DIGITALNIH SLIKAH
Uroš Mlakar, 2010, bachelor thesis/paper

Abstract: V tem diplomskem delu se ukvarjamo z razpoznavanjem obrazov in oči na digitalnih slikah. Najprej pregledamo obstoječe metode s tega področja, zatem pa razvijemo in implementiramo lasten algoritem za omenjen problem. Pri načrtovanju algoritma smo privzeli, da mora biti vhodna slika dobro osvetljena, na sliki se lahko nahaja zgolj ena oseba, pogled osebe pa je lahko poljuben. Algoritem sestoji iz treh zaporednih korakov. V prvem koraku ločimo obraz od ozadja, nato pa obraz izrežemo iz vhodne slike. V tretjem koraku še v zgornji polovici izrezane slike poiščemo oči. Uporabljena segmentacijska in klasifikacijska metoda je pragovna operacija. Algoritem smo preizkusili na 70 testnih slikah velikosti 255 x 300 slikovnih elementov, ki smo jih zajeli z digitalnim fotoaparatom. Uspešnost razpoznavanja oči je bila 85 % pri poljubnem pogledu osebe, pri frontalnem pogledu osebe pa je ta uspešnost narastla na 92,4 %.
Keywords: digitalna obdelava slik, razpoznavanje obrazov, razpoznavanje oči, segmentacija
Published: 06.12.2010; Views: 2320; Downloads: 183
.pdf Full text (1,20 MB)

72.
Segmentacija in grozdenje govorcev za sisteme avtomatskega razpoznavanja spontanega govora
Matej Grašič, 2010, dissertation

Abstract: V doktorski disertaciji obravnavamo problem segmentacije in grozdenja govorcev znotraj pogovornih, radijskih in televizijskih oddaj za sisteme avtomatskega razpoznavanja spontanega govora. Cilj predstavljene doktorske disertacije je definicija, implementacija in vrednotenje uspešnosti novega postopka za segmentacijo in grozdenje govorcev (diarizacijo govorcev). V okviru disertacije smo najprej realizirali referenčni online sistem za diarizacijo govorcev, ki temelji na postopku Bayesovega informacijskega kriterija (ang. »Bayesian Information Criterion« - BIC). Za referenčni sistem smo nato definirali akustične značilke z boljšo razločljivostjo govorcev v akustičnem prostoru. Nato smo dodali v postopek segmentacije statistični kriterij, kjer smo za normalizacijo rezultata kriterija uporabili univerzalni model govorca (ang. »Universal Background Model« - UBM). Ta postopek je predvsem uporaben v primerih, ko je akustične informacije znotraj segmentov premalo, da bi lahko zgradili popoln model govorca. V doktorski disertaciji smo vrednotili dva statistična kriterija in sicer razmerje križne verjetnosti (ang. »Cross Likelihood Ratio« - CLR) in normalizirano razmerje križne verjetnosti (ang. »Normalized Cross Likelihood Ratio« - NCLR). Oba kriterija izvirata s področja verifikacije govorcev, pri čemer je bila pokazana boljša uspešnost kriterija NCLR. V postopku segmentacije smo statistični kriterij uporabili kot dodatni pogoj, s katerim smo lahko izločili nepravilne prehode govorcev. Po določitvi najboljšega statističnega kriterija za področje segmentacije smo podoben pristop uporabili tudi za grozdenje. V primeru grozdenja smo kriterij BIC iz osnovnega sistema zamenjali s statističnim kriterijem za določitev grozdov. Pri tem smo vpeljali modeliranje govorca z več grozdi. Na tak način smo zajeli spreminjanje glasu govorca v posnetku. Na koncu smo optimirali celoten sistem z normalizacijo rezultata izbranega kriterija z referenčno vrednostjo kriterija; postopek je olajšal izbiro pragovne vrednosti ter izboljšal uspešnost. Prav tako smo izboljšali pravilno zaznavo kratkih segmentov govorca. To smo izvedli z adaptacijo statističnega kriterija glede na dolžino okna analize, kar je izboljšalo linearnost kriterija v primerih kratkega okna analize. V zadnji fazi smo izvedli končno ocenjevanje uspešnosti uporabljenih segmentacijskih algoritmov. Oceno uspešnosti predlaganega online sistema za diarizacijo govorcev smo izvedli na osnovi primerjave z osnovnim sistemom za diarizacijo govorcev, temelječim na postopku BIC. V drugi fazi smo primerjavo razširili na offline sisteme, kjer smo uporabili prosto dostopni offline diarizacijski sistem mClust . Za gradnjo univerzalnega modela splošnega govorca ter za določitev optimalnih vrednosti parametrov segmentacijskih postopkov smo uporabili učni del slovenske baze BNSI Broadcast News. Vrednotenje online in offline postopkov smo opravili na testnem delu slovenske in angleške govorne baze Broadcast News.
Keywords: segmentacija govorcev, grozdenje govorcev, online diarizacija govorcev, avtomatsko razpoznavanje spontanega govora, procesiranje govornega signala, akustične značilke, statistični kriteriji, razpoznavanje govorcev
Published: 01.07.2010; Views: 2404; Downloads: 180
.pdf Full text (1,75 MB)

73.
AKUSTIČNA SEGMENTACIJA ZVOČNIH SIGNALOV V DOMENI BROADCAST NEWS
Marko Kos, 2010, dissertation

Abstract: V doktorski disertaciji obravnavamo problematiko klasifikacije in segmentacije akustičnih signalov v domeni radijskih vsebin in televizijskih informativnih oddaj. Cilj predstavljene doktorske disertacije je zasnovati sistem za online akustično segmentacijo, ki bo podpiral tri vrste akustične segmentacije. To so: segmentacija govor/negovor (kjer smo velik poudarek dali segmentaciji govor/glasba, saj predstavlja glasba v domeni broadcast news večino negovornega materiala), segmentacija po spolu govorcev in segmentacija po pasovni širini signala. Za vsako vrsto akustične segmentacije, ki jo obravnavamo v doktorski nalogi, smo analizirali diskriminatorne sposobnosti nekaterih značilk, kako uspešne so te značilke pri razločevanju med posameznimi akustičnimi razredi. Za segmentacijo govor/negovor smo predlagali tudi nov vektor značilk VEFB (varianca energije filtrske banke). Značilke VEFB smo predlagali kot uspešen diskriminator za razločevanje predvsem med govorom in peto glasbo, izkazale pa so se tudi kot dober diskriminator med govorom in negovorom na splošno. Za analizo diskriminatornih sposobnosti značilk za razločevanje govornega in negovornega akustičnega razreda smo uporabili slovensko bazo BNSI Broadcast News, za analizo diskriminatornih sposobnosti razločevanja med govorom in glasbo pa smo uporabili bazo radijskih posnetkov. Za segmentacijo po spolu govorcev smo analizirali diskriminatorne sposobnosti značilk za razločevanje med moškimi govorci in ženskimi govorkami. Ker osnovna harmonska frekvenca ni zanesljiv diskriminator med moškimi in ženskimi glasovi, ob tem pa je sam postopek izločanja osnovne harmonske komponente občutljiv na slabše akustične razmere (šum, popačenje), smo razločevanje med moškimi in ženskimi glasovi izvedli s splošnimi akustičnimi značilkami. Značilke MFCC (mel-frekvenčni kepstralni koeficienti) so se v preteklosti že izkazale kot dober diskriminator med moškimi govorci in ženskimi govorkami. Da bi zmanjšali vpliv kratkočasovnih značilnosti govora in bolj poudarili splošne značilnosti govorca, smo izračunavali povprečne vrednosti značilk. Na ta način nam je uspelo poudariti tudi razlike med moškimi govorci in ženskimi govorkami, kar je prispevalo k večji diskriminatorni sposobnosti značilk. Za segmentacijo po pasovni širini signala smo prav tako analizirali diskriminatorne sposobnosti nekaterih splošnih akustičnih značilk in nekaterih bolj specifičnih značilk. Ob tem smo predlagali tudi tri nove značilke za razločevanje med širokopasovnim studijskim govorom in ozkopasovnim telefonskim govorom, med katerimi se je kot najboljša izkazala značilka PMSU (povprečna vrednost modificiranega spektralnega upada). Ob značilki PMSU smo predlagali še značilki VPVFB (varianca povprečne vrednosti frekvenčnih binov) in VEVF (varianca energije višjih frekvenc). Značilki PMSU in VEVF sta se obnesli kot dober diskriminator med studijskim in telefonskim govorom, še posebej značilka PMSU, ki je dosegla dovolj dober rezultat, da bi jo lahko uporabili kot samostojni diskriminator. Zaradi enostavnosti izračunavanja je še posebej primerna za aplikacije, kjer sta pomnilnik in procesorska moč omejena. Ker ima značilka eno samo vrednost, lahko za klasifikacijo posameznih okvirjev uporabimo kar pragovni klasifikator, ki je zelo preprost in je prav tako primeren za enostavne sisteme in aplikacije. Na osnovi analiz diskriminatornih sposobnosti značilk za posamezne vrste akustične segmentacije smo zasnovali zgradbo sistema za online akustično segmentacijo. Znotraj modula za segmentacijo smo predlagali nov pristop k združevanju posameznih okvirjev v večje homogene segmente. Sistem temelji na uporabi dveh ločenih števcev okvirjev posameznih akustičnih razredov ter pravil segmentacije. Pravila segmentacije določajo minimalne čase trajanja segmentov posameznih akustičnih razredov. Minimalni časi trajanja posameznih akustičnih segmentov so načeloma odvisni od domene. Za bazo BNSI in bazo radijskih posnetkov smo jih ocenili s pomočj
Keywords: akustična segmentacija, akustična klasifikacija, segmentacija govor/negovor, segmentacija govor/glasba, segmentacija po spolu govorca, segmentacija po pasovni širini signala, online segmentacija, procesiranje govora, avtomatsko razpoznavanje govora
Published: 01.07.2010; Views: 2436; Downloads: 221
.pdf Full text (6,79 MB)

74.
ODKRIVANJE OBJEKTOV NEPRAVILNIH OBLIK V NARAVNEM OKOLJU S POMOČJO PROSTORSKO-FREKVENČNE ANALIZE IN ELASTIČNE PORAVNAVE SLIK
Jurij Rakun, 2010, dissertation

Abstract: V doktorski disertaciji opisujemo nov način odkrivanja objektov nepravilnih oblik v naravnem okolju. Postopek se začne v slikovnem prostoru s posameznimi slikami iste opazovane scene. Upošteva uveljavljene rešitve, kot so predobdelava slik s klasičnimi prijemi za izboljšanje kontrasta, odpravljanje različnih osvetljenosti in odstranjevanje šuma ter pragovna barvna segmentacija slik, ki upošteva znane barvne lastnosti iskanih objektov. Osrednja prispevka disertacije pomenita izpopolnjeno odkrivanje objektov z nepravilnimi oblikami in razširjata analizo tekstur v frekvenčnem prostoru ter 3D rekonstrukcijo s pomočjo geometrije več pogledov. Teksturno analizo izvedemo z 2D prostorsko-frekvenčnim pristopom oziroma z 2D Wigner-Villeovo predstavitvijo. Z njo poiščemo območja podobnih frekvenčnih karakteristik, ki enolično določajo teksture iskanih objektov. Kadar so objekti delno zakriti ali imajo podobne barvne lastnosti kot ozadje, tudi analiza tekstur ni dovolj občutljiva. Da bi izboljšali robustnost, smo v postopku odkrivanja uporabili več slik iste scene in izsledke z geometrijo več pogledov. Bistvena novost te razširitve je določanje korespondenčnih točk, na katerih temelji 3D rekonstrukcija opazovane scene. Rekonstrukcija mora biti tako detaljna, da so nepravilne prostorske oblike zanesljivo razpoznavne in da jih lahko uporabimo pri končnem potrjevanju iskanih objektov. Ustrezno gostoto korespondenčnih točk dosežemo tako, da pare posnetkov elastično poravnamo in iz parametrov za poravnavo oziroma iz deformacijskih matrik izračunamo ujemanje slikovnih točk. Med njimi izberemo čim večje število dobro ujemajočih se parov, za kar smo uvedli tudi posebno mero zanesljivosti. Izbrane pare uporabimo kot korespondenčne točke v 3D rekonstrukciji opazovane scene. Končno odločitev o najdenih objektih sprejmemo s povezovanjem informacij, pridobljenih v prostorsko-frekvenčnih predstavitvah in njihovih 3D rekonstruiranih oblikah. Učinkovitost razvitega razpoznavalnega postopka smo preverili z realnimi posnetki sadnih dreves. Poskuse smo zasnovali tako, da smo ugotavljali, kako se izboljša razpoznavanje plodov, če poleg znanih postopkov barvne segmentacije v slikovnem prostoru uporabimo še predlagani nadgradnji s prostorsko-frekvenčnimi značilnicami in z geometrijo več pogledov. Opazovane posnetke smo razdelili v štiri skupine: barvno ločljivi objekti (npr. rdeči plodovi, brez večjih zakrivanj), barvno ločljivi objekti z zakrivanji, barvno teže ločljivi objekti (npr. zeleni plodovi, brez večjih zakrivanj) in barvno teže ločljivi objekti z zakrivanji. Rezultati raziskave kažejo, da je uvedeni postopek za odkrivanje objektov nepravilnih oblik v naravnem okolju primeren, saj dosega v povprečju 86 % natančnost določanja korespondenčnih točk, in pripomore k natančnejšemu odkrivanju objektov (plodov na sadnem drevju). Tako lahko pomembno izboljšamo dosedanjo avtomatizirano, računalniško spremljanje in napovedovanje pridelka v sadjarstvu.
Keywords: segmentacija slik, analiza tekstur, poravnava slik, afina transformacija, geometrija več pogledov, korespondenčne točke, 3D rekonstrukcija, analiza 3D oblik
Published: 06.05.2010; Views: 2403; Downloads: 157
.pdf Full text (6,04 MB)

75.
SEGMENTACIJA TRGA UPORABNIKOV MOBILNIH TELEFONOV ZNAMKE MOTOROLA
Robert Dežman, 2009, undergraduate thesis

Abstract: Segmentiranje trga uporabnikov mobilnih aparatov znamke Motorola je delo, ki je nastajalo v daljšem časovnem obdobju in sicer med septembrom 2007 in majem 2008. Prineslo je kar nekaj zanimivih ugotovitev iz področja mobilne telefonije, o katerih do sedaj nisem razmišljal, saj sem gledal na trg skozi oči prodajalca in se nisem postavljal v kožo uporabnika. Vedeti je potrebno, kaj potrebuje povprečni uporabnik mobitela. Moje gledanje na mobilne aparate je pristransko saj sem tehničen človek, ki išče popolnoma druge stvari pri mobilnih aparatih. Z omenjeno raziskavo trga pa sem pridobil podatke, ki bodo meni in našemu podjetju v pomoč pri nadaljnjem delu. Najbolj me je razveselilo dejstvo, da obstaja trg mogočih uporabnikov kateri ni zanemarljiv. Če ga primerjam z trgom rednih uporabnikov je le ta večji za več kot 3 krat. Predvsem je tu prostor pri ženski populaciji, medtem, ko moški niso toliko navdušeni nad mobilnimi aparati Motorola in potrebujejo več osebnega prepričevanja. Motorola je dobro zapisana v regijah in mestih ob meji z Italijo in Avstrijo, medtem, ko smo izredno šibki v osrednji Sloveniji in dolenjski regiji. Ker živi tu največji del prebivalstva, bo potrebno vložiti veliko moči (sredstev in dela). Osredotočiti se je potrebno na najmlajšo skupino od 15 do 25 let, saj bo ta skupina v prihodnosti tvorila jedro naših kupcev. Ta skupina je zelo zahtevna, saj ima tehnično znanje in poznavanje tujih jezikov (nima jezikovnih ovir), hkrati pa se je pokazala kot najmanj pripadna blagovnim znamkam. Smer razvoja mobilnih aparatov gre v tako imenovane »multifunkcijske« naprave, katere morajo nuditi veliko storitev (kvalitetni fotoaparat, kvalitetni zaslon na dotik). Uporaba storitev, katere ponujajo operaterji, počasi a vztrajno rastejo. Do sedaj je namreč polno izkoriščena le funkcija govora. Od omenjenih ostalih storitev pa so priljubljene storitve vezane na zabavo. Zaradi omenjenih funkcij je postala baterija najšibkejši člen mobilnih aparatov. Zato se bo v prihodnosti potrebno osredotočiti na vzdržljivost baterije, le ta bo namreč pokazatelj kvalitete mobilnih aparatov. Za dosego teh zahtev pa je potrebna nova tehnologija in novi materiali. Proizvajalci pospešeno vlagajo denar v rešitev tega problema in tisti, ki bo prvi uspel, si bo zopet ustvaril prednost na trgu. Mobilni aparat je redek izdelek, ki spremlja človeka od rojstva pa do smrti, zato se je potrebno posvetiti tudi skupini starejših ljudi in pa najmlajših. To je možno z malimi popravki, kot so velike črke in številke dohodnih klicev, ter svetlobnimi efekti in barvnimi kombinacijami mobilnih aparatov.
Keywords: segmentacija, množično trženje, mikrotrženje, primarni podatki, sekundarni podatki, interni podatki, eksterni podatki, operater, mobilni aparat, intervju, raziskava trga, trg mobilnih aparatov, segmentacijska osnova
Published: 17.11.2009; Views: 3532; Downloads: 432
.pdf Full text (873,66 KB)

76.
77.
78.
79.
80.
Search done in 0.33 sec.
Back to top
Logos of partners University of Maribor University of Ljubljana University of Primorska University of Nova Gorica