1. Izločanje značilk pogovornih gest iz video signala za rekonstrukcijo gest in njihovo uporabo v kinematičnem modelu virtualnega pogovornega agenta : doktorska disertacijaGrega Močnik, 2023, doktorska disertacija Opis: Za poustvarjanje prepričljivih in človekovim podobnih pogovornih odzivov, mora
umetna entiteta, tj. utelešeni pogovorni agent, v govorjeni socialni interakciji izražati
korelirana govor (besedno) in geste (nebesedno). Večina obstoječih del se osredotoča
na načrtovanje namena in načrtovanje vedenja. Realizacija je prepuščena omejenemu
naboru statičnih 3D prikazov pogovornih izrazov. Poleg funkcionalne in pomenske
sinhronosti med verbalnimi in neverbalnimi signali končno vernost izraza oblikuje
fizična realizacija neverbalnih izrazov. Glavni izziv večine pogovornih sistemov,
zmožnih reproduciranja gest, je raznolikost izraznosti. V doktorskem delu
obravnavamo postopke za samodejno zajemanje gest iz videoposnetkov in njihovo
preoblikovanje v 3D prikaze, shranjene kot del repozitorija motoričnih veščin
pogovornega agenta. Posebna pozornost je posvečena izločanju značilk z dovolj
kakovostno informacijo, da je rekonstruirano pogovorno izražanje naravno in čim
vernejše. Predlagan je sistem za rekonstrukcijo pogovornih gest, ki zagotavlja
naravnost gest utelešenega pogovornega agenta, posledica česar je bolj kakovostna
interakcija med človekom in računalnikom. Predlagan sistem temelji na sledilniku
Kanade–Lucas–Tomasi, filtru Savitzky–Golay, kinematičnem modelu na osnovi
Denavit–Hartenberg in ogrodju EVA. Obravnavana je ocena sintetiziranega izraznega
gibanja in namesto subjektivne ocene sintetiziranega gibanja podana objektivna
metoda, temelječa na kosinusni podobnosti. Empirično je predstavljena tudi ocena
gibanja, rekonstruiranega s predlaganim sistemom za rekonstrukcijo. Ključne besede: značilke pogovornih gest, rekonstrukcija, virtualni pogovorni agenti, Denavit-Hartenberg, Kanade–Lucas–Tomasi, filter Savitzky–Golay, video Objavljeno v DKUM: 03.08.2023; Ogledov: 606; Prenosov: 82 Celotno besedilo (2,61 MB) |
2. Storitev interaktivnega spremljanja avdiovizualnih vsebin v okolju IPTV : master's thesisLuka Banfi, 2022, magistrsko delo Opis: V magistrskem delu je opisana teoretična zasnova celostne kontekstno prožene interaktivne storitve IPTV, pri kateri imajo uporabniki možnost izražanja, oz. pridajanja različnih čustvenih simbolov v okviru mikro družabnih omrežij ob skupinskem ogledu vsebin IPTV. Opisana storitev se vsebinsko osredotoča na nogomet, saj gre za enega od najpopularnejših športov, ki je zelo priljubljen med uporabniki IPTV. Pri implementaciji praktičnega dela smo se osredotočili na implementacijo uporabniškega vmesnika in komunikacije med strežnikom in odjemalci. Ključne besede: IPTV, interaktivnost, konvolucijske nevronske mreže Objavljeno v DKUM: 25.01.2023; Ogledov: 680; Prenosov: 63 Celotno besedilo (3,56 MB) |
3. |
4. Capturing Conversational Gestures for Embodied Conversational Agents Using an Optimized Kaneda–Lucas–Tomasi Tracker and Denavit–Hartenberg-Based Kinematic ModelGrega Močnik, Zdravko Kačič, Riko Šafarič, Izidor Mlakar, 2022, izvirni znanstveni članek Opis: In order to recreate viable and human-like conversational responses, the artificial entity, i.e., an embodied conversational agent, must express correlated speech (verbal) and gestures (non-verbal) responses in spoken social interaction. Most of the existing frameworks focus on intent planning and behavior planning. The realization, however, is left to a limited set of static 3D representations of conversational expressions. In addition to functional and semantic synchrony between verbal and non-verbal signals, the final believability of the displayed expression is sculpted by the physical realization of non-verbal expressions. A major challenge of most conversational systems capable of reproducing gestures is the diversity in expressiveness. In this paper, we propose a method for capturing gestures automatically from videos and transforming them into 3D representations stored as part of the conversational agent’s repository of motor skills. The main advantage of the proposed method is ensuring the naturalness of the embodied conversational agent’s gestures, which results in a higher quality of human-computer interaction. The method is based on a Kanade–Lucas–Tomasi tracker, a Savitzky–Golay filter, a Denavit–Hartenberg-based kinematic model and the EVA framework. Furthermore, we designed an objective method based on cosine similarity instead of a subjective evaluation of synthesized movement. The proposed method resulted in a 96% similarity. Ključne besede: conversational gestures, 3D gestures, motor skills, gesture reconstruction, kinematics, embodied conversational agents, Kanade–Lucas–Tomasi tracker, Denavit–Hartenberg Objavljeno v DKUM: 20.01.2023; Ogledov: 605; Prenosov: 70 Celotno besedilo (5,04 MB) Gradivo ima več datotek! Več... |
5. Upravljanje videoklicev in videokonferenc za arhitekturo IP-multimedijskega podsistema : diplomsko deloMartin Cvetko, 2020, diplomsko delo Opis: V okviru diplomskega dela smo se seznanili z delovanjem arhitekture IP-multimedijskega podsistema in zanj razvili sistem upravljanja video klicev in videokonferenc. Predstavili smo osnovne principe delovanja podsistema, potek komunikacije in prenos podatkov znotraj arhitekture in z zunanjimi komponentami - z dvema ali več odjemalci. S pomočjo oblačne arhitekture Clearwater IMS smo zasnovali primerno okolje za izvedbo video klica, ki smo ga nadgradili s komponentami video konference.
Opisali smo različne tehnologije in aplikacije, ki so bile pomembne pri razvoju arhitekture ali so potrebne pri delovanju video klicev in video konferenc. Implementacija video klicev in konferenc je bila izvedena v virtualnem okolju. Ključne besede: IP-MULTIMEDIJSKI PODSISTEM, VIDEOKLIC, VIDEO KONFERENCA, SIP Objavljeno v DKUM: 11.11.2020; Ogledov: 1136; Prenosov: 106 Celotno besedilo (1,36 MB) |
6. |
7. Prozodične značilnosti govora v povezavi z osebnostjo govorcaSara Tepeš, 2019, magistrsko delo Opis: Namen pričujočega dela je preučiti povezavo med osebnostjo govorca in naborom prozodičnih značilnosti govora na slovenskem vzorcu. V študiji smo uporabili pet govornih nalog, ki so si sledile od bolj kontroliranega govora k bolj spontanemu, saj nas je zanimalo tudi, ali izbira naloge vpliva na naravo povezav. V raziskavi je sodelovalo 69 udeležencev (30 moških in 39 žensk). Udeleženci so izpolnili samoocenjevalni vprašalnik BFI-2, ki meri velikih pet faktorjev osebnosti in lestvico asertivnosti IPP-NEO 300, nato so bili posneti pri izvajanju govornih nalog. Posnetke smo analizirali s pomočjo programske opreme PRAAT Windows 6.0.47. Analize so pokazale, da se ekstravertnost povezuje z višjim in glasnejšim govorom. Bralna pogoja med ekstravertnostjo in merami tekočnosti govora nista pokazala povezav, medtem ko se je pri spontanem govoru pokazalo, da ekstravertirani posamezniki govorijo več. Negativna emocionalnost se je najpogosteje povezovala z merami tekočnosti govora. Nadaljnje analize nakazujejo, da se med asertivnostjo in višino glasu pojavlja nelinearen U-odnos, ravno tako se asertivnost povezuje z glasnejšim govorom in uporabo večjega števila daljših premorov. Za ostale lastnosti so bile povezave med pogoji manj konsistentne. Omenjene povezave so se pokazale samo za moške glasove. Ugotovitve vsekakor dokazujejo, da med osebnostjo in govorom obstajajo določene, četudi šibke povezave. Ključne besede: prozodične značilnosti govora, govor, glas, osebnost Objavljeno v DKUM: 19.09.2019; Ogledov: 1306; Prenosov: 143 Celotno besedilo (1,85 MB) |
8. Prepoznavanje obraza slavnih oseb v videoposnetkih : magistrsko deloFeliks Gorišek, 2019, magistrsko delo Opis: Magistrsko delo sodi na področje digitalne obdelave slik in videa. Prepoznavanje obrazov je danes prisotno že na skoraj vseh mobilnih napravah višjega cenovnega razreda. Področje prepoznavanja obrazov v video posnetkih pa še v komercialni uporabi ni tako uveljavljeno, zato bomo to področje raziskali. V teoretičnem delu magistrskega dela smo podali teoretične osnove iskanja ključnih točk in določanja ujemanja obrazov. V praktičnem delu magistrskega dela naloge smo definiran teoretični sistem prepoznavanja obrazov implementirali kot storitev prepoznavanja slavnih oseb v video posnetkih. Izvedli smo teste praktične uporabe, podali eksperimentalne rezultate in analizirali uporabno vrednost. Ključne besede: algoritem SURF, odkrivanje obrazov, prepoznavanje obrazov Objavljeno v DKUM: 21.06.2019; Ogledov: 1888; Prenosov: 119 Celotno besedilo (10,37 MB) |
9. Zasnova mobilne aplikacije za prenos videa v živo v okoljih IMS : [projekt]Aljaž Aš, 2019, diplomsko delo Opis: Zaključni projekt obravnava zasnovo in izvedbo mobilne aplikacije za mobilno platformo Android, ki omogoča prenos videa z mobilne naprave na končno napravo v sistemu IMS (IP Multimedia Subsystem). Cilj je izdelati čim bolj priročno ter uporabniku prijazno aplikacijo, ki najbolj optimalno deluje v okolju IMS, hkrati pa predstavlja razvoj in kasnejšo uporabo tovrstnih aplikacij na svetovnem trgu. V nalogi opišemo uporabljene protokole za vzpostavitev seje in zapis ter prenos multimedijske vsebine po omrežju med napravama, naredimo kratek povzetek strukture sistema IMS, analiziramo omrežne zahteve ter predstavimo uporabljeno razvojno okolje, integracijo odprtokodnih rešitev ter zasnovo in razvoj aplikacije. Ključne besede: IMS, video, prenos v živo, mobilna aplikacija, SIP Objavljeno v DKUM: 16.05.2019; Ogledov: 1541; Prenosov: 119 Celotno besedilo (9,78 MB) |
10. Razvoj varnostnega sistema v okolju IoTMilan Mitrović, 2018, diplomsko delo Opis: V diplomski nalogi najprej obravnavamo rešitve varnostnih sistemov, kot jih dandanes že poznamo v IoT okoljih. V nadaljevanju nato predlagamo zasnovo sistema varovanja na Seeduino Stakler platformi. V drugem delu naloge pa nato podrobno predstavljamo razvoj varnostnega sistema za IoT okolje na osnovi Seeduino Stakler platforme. Pri razvoju smo uporabili tudi programski paket Altium Designer za razvoj elektronske platforme. Za razvoj programske opreme smo uporabili Arduino Software IDE. Jedro naloge predstavlja realizacija sistema varovanja in razvoj pripadajoče programske kode. V zaključku povzamemo opravljeno delo, predstavimo rezultate meritev in testiranj, ter podamo tudi predloge za nadgradnjo sistema. Ključne besede: IoT, inteligentno okolje, sistem varovanja, Seeduino Stalker platforma, XBee modul, ZigBee komunikacija Objavljeno v DKUM: 08.11.2018; Ogledov: 1095; Prenosov: 123 Celotno besedilo (4,64 MB) |