1. Izločanje značilk pogovornih gest iz video signala za rekonstrukcijo gest in njihovo uporabo v kinematičnem modelu virtualnega pogovornega agenta : doktorska disertacijaGrega Močnik, 2023, doctoral dissertation Abstract: Za poustvarjanje prepričljivih in človekovim podobnih pogovornih odzivov, mora
umetna entiteta, tj. utelešeni pogovorni agent, v govorjeni socialni interakciji izražati
korelirana govor (besedno) in geste (nebesedno). Večina obstoječih del se osredotoča
na načrtovanje namena in načrtovanje vedenja. Realizacija je prepuščena omejenemu
naboru statičnih 3D prikazov pogovornih izrazov. Poleg funkcionalne in pomenske
sinhronosti med verbalnimi in neverbalnimi signali končno vernost izraza oblikuje
fizična realizacija neverbalnih izrazov. Glavni izziv večine pogovornih sistemov,
zmožnih reproduciranja gest, je raznolikost izraznosti. V doktorskem delu
obravnavamo postopke za samodejno zajemanje gest iz videoposnetkov in njihovo
preoblikovanje v 3D prikaze, shranjene kot del repozitorija motoričnih veščin
pogovornega agenta. Posebna pozornost je posvečena izločanju značilk z dovolj
kakovostno informacijo, da je rekonstruirano pogovorno izražanje naravno in čim
vernejše. Predlagan je sistem za rekonstrukcijo pogovornih gest, ki zagotavlja
naravnost gest utelešenega pogovornega agenta, posledica česar je bolj kakovostna
interakcija med človekom in računalnikom. Predlagan sistem temelji na sledilniku
Kanade–Lucas–Tomasi, filtru Savitzky–Golay, kinematičnem modelu na osnovi
Denavit–Hartenberg in ogrodju EVA. Obravnavana je ocena sintetiziranega izraznega
gibanja in namesto subjektivne ocene sintetiziranega gibanja podana objektivna
metoda, temelječa na kosinusni podobnosti. Empirično je predstavljena tudi ocena
gibanja, rekonstruiranega s predlaganim sistemom za rekonstrukcijo. Keywords: značilke pogovornih gest, rekonstrukcija, virtualni pogovorni agenti, Denavit-Hartenberg, Kanade–Lucas–Tomasi, filter Savitzky–Golay, video Published in DKUM: 03.08.2023; Views: 610; Downloads: 82 Full text (2,61 MB) |
2. Storitev interaktivnega spremljanja avdiovizualnih vsebin v okolju IPTV : master's thesisLuka Banfi, 2022, master's thesis Abstract: V magistrskem delu je opisana teoretična zasnova celostne kontekstno prožene interaktivne storitve IPTV, pri kateri imajo uporabniki možnost izražanja, oz. pridajanja različnih čustvenih simbolov v okviru mikro družabnih omrežij ob skupinskem ogledu vsebin IPTV. Opisana storitev se vsebinsko osredotoča na nogomet, saj gre za enega od najpopularnejših športov, ki je zelo priljubljen med uporabniki IPTV. Pri implementaciji praktičnega dela smo se osredotočili na implementacijo uporabniškega vmesnika in komunikacije med strežnikom in odjemalci. Keywords: IPTV, interaktivnost, konvolucijske nevronske mreže Published in DKUM: 25.01.2023; Views: 687; Downloads: 64 Full text (3,56 MB) |
3. |
4. Capturing Conversational Gestures for Embodied Conversational Agents Using an Optimized Kaneda–Lucas–Tomasi Tracker and Denavit–Hartenberg-Based Kinematic ModelGrega Močnik, Zdravko Kačič, Riko Šafarič, Izidor Mlakar, 2022, original scientific article Abstract: In order to recreate viable and human-like conversational responses, the artificial entity, i.e., an embodied conversational agent, must express correlated speech (verbal) and gestures (non-verbal) responses in spoken social interaction. Most of the existing frameworks focus on intent planning and behavior planning. The realization, however, is left to a limited set of static 3D representations of conversational expressions. In addition to functional and semantic synchrony between verbal and non-verbal signals, the final believability of the displayed expression is sculpted by the physical realization of non-verbal expressions. A major challenge of most conversational systems capable of reproducing gestures is the diversity in expressiveness. In this paper, we propose a method for capturing gestures automatically from videos and transforming them into 3D representations stored as part of the conversational agent’s repository of motor skills. The main advantage of the proposed method is ensuring the naturalness of the embodied conversational agent’s gestures, which results in a higher quality of human-computer interaction. The method is based on a Kanade–Lucas–Tomasi tracker, a Savitzky–Golay filter, a Denavit–Hartenberg-based kinematic model and the EVA framework. Furthermore, we designed an objective method based on cosine similarity instead of a subjective evaluation of synthesized movement. The proposed method resulted in a 96% similarity. Keywords: conversational gestures, 3D gestures, motor skills, gesture reconstruction, kinematics, embodied conversational agents, Kanade–Lucas–Tomasi tracker, Denavit–Hartenberg Published in DKUM: 20.01.2023; Views: 616; Downloads: 73 Full text (5,04 MB) This document has many files! More... |
5. Upravljanje videoklicev in videokonferenc za arhitekturo IP-multimedijskega podsistema : diplomsko deloMartin Cvetko, 2020, undergraduate thesis Abstract: V okviru diplomskega dela smo se seznanili z delovanjem arhitekture IP-multimedijskega podsistema in zanj razvili sistem upravljanja video klicev in videokonferenc. Predstavili smo osnovne principe delovanja podsistema, potek komunikacije in prenos podatkov znotraj arhitekture in z zunanjimi komponentami - z dvema ali več odjemalci. S pomočjo oblačne arhitekture Clearwater IMS smo zasnovali primerno okolje za izvedbo video klica, ki smo ga nadgradili s komponentami video konference.
Opisali smo različne tehnologije in aplikacije, ki so bile pomembne pri razvoju arhitekture ali so potrebne pri delovanju video klicev in video konferenc. Implementacija video klicev in konferenc je bila izvedena v virtualnem okolju. Keywords: IP-MULTIMEDIJSKI PODSISTEM, VIDEOKLIC, VIDEO KONFERENCA, SIP Published in DKUM: 11.11.2020; Views: 1143; Downloads: 107 Full text (1,36 MB) |
6. Uporaba postopka oblikovanja snopa za lokalizacijo zvočnih izvorov s pomočjo akustične kamere : magistrsko deloŽan Tomazini, 2019, master's thesis Abstract: Postopki oblikovanja snopa se v sistemih akustičnih kamer uporabljajo za lokalizacijo zvočnih izvorov in pridobivanje zvočne slike prostora. Večina temelji na preračunavanju TDOA med posameznimi mikrofonskimi pari in izvajanju zamik-in-vsota nad signali. Ena izmed možnosti računanja koordinat izvora je multilateracija, s čimer pa ne dobimo celotne zvočne slike. SRP-PHAT je robusten postopek s katerim oblikujemo snop mikrofonskega polja in ga usmerimo v množico točk v iskalnem prostoru. S tem pridobimo informacijo o moči zvoka in lahko posledično določimo položaj zvočnega izvora. Računanje SRP-PHAT je procesno zahtevno, zato uporabimo SRC kot učinkovit način iskanja globalnega maksimuma. Keywords: oblikovanje snopa, SRP-PHAT, akustična kamera, lokalizacija zvočnega izvora Published in DKUM: 13.11.2019; Views: 1232; Downloads: 84 Full text (4,71 MB) |
7. Prozodične značilnosti govora v povezavi z osebnostjo govorcaSara Tepeš, 2019, master's thesis Abstract: Namen pričujočega dela je preučiti povezavo med osebnostjo govorca in naborom prozodičnih značilnosti govora na slovenskem vzorcu. V študiji smo uporabili pet govornih nalog, ki so si sledile od bolj kontroliranega govora k bolj spontanemu, saj nas je zanimalo tudi, ali izbira naloge vpliva na naravo povezav. V raziskavi je sodelovalo 69 udeležencev (30 moških in 39 žensk). Udeleženci so izpolnili samoocenjevalni vprašalnik BFI-2, ki meri velikih pet faktorjev osebnosti in lestvico asertivnosti IPP-NEO 300, nato so bili posneti pri izvajanju govornih nalog. Posnetke smo analizirali s pomočjo programske opreme PRAAT Windows 6.0.47. Analize so pokazale, da se ekstravertnost povezuje z višjim in glasnejšim govorom. Bralna pogoja med ekstravertnostjo in merami tekočnosti govora nista pokazala povezav, medtem ko se je pri spontanem govoru pokazalo, da ekstravertirani posamezniki govorijo več. Negativna emocionalnost se je najpogosteje povezovala z merami tekočnosti govora. Nadaljnje analize nakazujejo, da se med asertivnostjo in višino glasu pojavlja nelinearen U-odnos, ravno tako se asertivnost povezuje z glasnejšim govorom in uporabo večjega števila daljših premorov. Za ostale lastnosti so bile povezave med pogoji manj konsistentne. Omenjene povezave so se pokazale samo za moške glasove. Ugotovitve vsekakor dokazujejo, da med osebnostjo in govorom obstajajo določene, četudi šibke povezave. Keywords: prozodične značilnosti govora, govor, glas, osebnost Published in DKUM: 19.09.2019; Views: 1309; Downloads: 143 Full text (1,85 MB) |
8. Prepoznavanje obraza slavnih oseb v videoposnetkih : magistrsko deloFeliks Gorišek, 2019, master's thesis Abstract: Magistrsko delo sodi na področje digitalne obdelave slik in videa. Prepoznavanje obrazov je danes prisotno že na skoraj vseh mobilnih napravah višjega cenovnega razreda. Področje prepoznavanja obrazov v video posnetkih pa še v komercialni uporabi ni tako uveljavljeno, zato bomo to področje raziskali. V teoretičnem delu magistrskega dela smo podali teoretične osnove iskanja ključnih točk in določanja ujemanja obrazov. V praktičnem delu magistrskega dela naloge smo definiran teoretični sistem prepoznavanja obrazov implementirali kot storitev prepoznavanja slavnih oseb v video posnetkih. Izvedli smo teste praktične uporabe, podali eksperimentalne rezultate in analizirali uporabno vrednost. Keywords: algoritem SURF, odkrivanje obrazov, prepoznavanje obrazov Published in DKUM: 21.06.2019; Views: 1893; Downloads: 119 Full text (10,37 MB) |
9. Zasnova mobilne aplikacije za prenos videa v živo v okoljih IMS : [projekt]Aljaž Aš, 2019, undergraduate thesis Abstract: Zaključni projekt obravnava zasnovo in izvedbo mobilne aplikacije za mobilno platformo Android, ki omogoča prenos videa z mobilne naprave na končno napravo v sistemu IMS (IP Multimedia Subsystem). Cilj je izdelati čim bolj priročno ter uporabniku prijazno aplikacijo, ki najbolj optimalno deluje v okolju IMS, hkrati pa predstavlja razvoj in kasnejšo uporabo tovrstnih aplikacij na svetovnem trgu. V nalogi opišemo uporabljene protokole za vzpostavitev seje in zapis ter prenos multimedijske vsebine po omrežju med napravama, naredimo kratek povzetek strukture sistema IMS, analiziramo omrežne zahteve ter predstavimo uporabljeno razvojno okolje, integracijo odprtokodnih rešitev ter zasnovo in razvoj aplikacije. Keywords: IMS, video, prenos v živo, mobilna aplikacija, SIP Published in DKUM: 16.05.2019; Views: 1545; Downloads: 119 Full text (9,78 MB) |
10. Razvoj varnostnega sistema v okolju IoTMilan Mitrović, 2018, undergraduate thesis Abstract: V diplomski nalogi najprej obravnavamo rešitve varnostnih sistemov, kot jih dandanes že poznamo v IoT okoljih. V nadaljevanju nato predlagamo zasnovo sistema varovanja na Seeduino Stakler platformi. V drugem delu naloge pa nato podrobno predstavljamo razvoj varnostnega sistema za IoT okolje na osnovi Seeduino Stakler platforme. Pri razvoju smo uporabili tudi programski paket Altium Designer za razvoj elektronske platforme. Za razvoj programske opreme smo uporabili Arduino Software IDE. Jedro naloge predstavlja realizacija sistema varovanja in razvoj pripadajoče programske kode. V zaključku povzamemo opravljeno delo, predstavimo rezultate meritev in testiranj, ter podamo tudi predloge za nadgradnjo sistema. Keywords: IoT, inteligentno okolje, sistem varovanja, Seeduino Stalker platforma, XBee modul, ZigBee komunikacija Published in DKUM: 08.11.2018; Views: 1097; Downloads: 123 Full text (4,64 MB) |