1. Napovedni model gibanja tržnih cen s pomočjo analize sentimenta : magistrsko deloDavid Pintarič, 2022, magistrsko delo Opis: Na svetu obstajajo številni trgi, kjer lahko kupci in prodajalci trgujejo s finančnimi inštrumenti. Ker se cene na trgih neprestano spreminjajo, lahko to lastnost, ki jo imenujemo nestanovitnost, izkoristimo in, če imamo pravilno napoved, ustvarimo profit. V sklopu magistrskega dela se problema pravilne napovedi lotimo z uporabo analize sentimenta in jezikovnih tehnologij. S pomočjo objav uporabnikov na socialnem omrežju Twitter izdelamo model, ki napove gibanje tržne cene kriptovalute Bitcoin. Preizkusimo več različnih algoritmov za klasifikacijo sentimenta. Najboljše rezultate dosežemo z metodo podpornih vektorjev. Ugotovimo, da sta izdelan model in analiza sentimenta uporabna za napoved tržne cene, vendar sama po sebi nista dovolj natančna, da bi ju lahko uporabili kot edini kazalnik. Oba sta bolj primerna kot del večjega sistema za podporo pri odločanju. Ključne besede: procesiranje naravnega jezika, analiza sentimenta, trgovanje, napovedni model Objavljeno v DKUM: 25.10.2022; Ogledov: 600; Prenosov: 96
Celotno besedilo (5,53 MB) |
2. |
3. Izdelava sistema za določanje geografskega in časovnega pokritja v besedilihAleš Pečovnik, 2016, diplomsko delo Opis: V diplomskem delu je opisan celoten postopek izdelave sistema, ki določa geografsko in časovno pokritje besedil. Slednje spada v področje določanja imenskih entitet. Sistem je izdelan s prosto dostopnimi podatkovnimi viri in programskimi rešitvami, zato so v prvem delu opisani ti podatkovni viri, kako so bili njihovi podatki združeni za ustvaritev zemljevida in označevanja entitet. Potem sledi opis uporabljenih orodij in kako so bila uporabljena. Za tem sledi opis postopka označevanja geografskih in časovnih entitet ter na koncu še predstavitev implementacije, delovanja sistema in izgled spletnih strani, uporabljenih za interakcijo z uporabniki. Zastavljeni cilji so bili uresničeni, sistem deluje kot načrtovano in označevanje daje pričakovane rezultate. Ključne besede: procesiranje naravnega jezika, določanje imenskih entitet, geografska pokritost, časovna pokritost, določanje pokritosti besedil, Geonames, OpenStreetMap Objavljeno v DKUM: 06.09.2016; Ogledov: 1389; Prenosov: 110
Celotno besedilo (2,03 MB) |
4. IMPLEMENTACIJA VIRTUALNEGA AGENTA Z ODPRTO-KODNO REŠITVIJO VERBOT ENGINEDavid Kolarič, 2014, diplomsko delo Opis: Pričujoče diplomsko delo temelji na raziskavi virtualnih agentov in uporabi ogrodij za vzpostavitev le-teh. Predstavljen je primer implementacije virtualnega agenta.
Sprva smo povzeli že znana teoretična izhodišča. Predstavili smo tri referenčne primere,
ter podali različna ogrodja za vzpostavitev virtualnih agentov in jih analizirali. S tem smo se nato odločili za ogrodje, ki smo ga uporabili za vzpostavitev našega virtualnega agenta. Nadalje smo pogledali ekspertne sisteme in procesiranje naravnega jezika, ter uporabo regularnih izrazov v programskem jeziku C#. Predstavili smo rešitev Verbot engine 5, s katero smo izdelali virtualnega agenta, ki uporabniku omogoča hitro pridobivanje informacij o filmih, ki se predvajajo v slovenskih kinematografih. Pri tem smo se omejili na kinematografe Planet Tuš in Kolosej. Prikazali smo pridobivanje in shranjevanje podatkov, ter dostop virtualnega agenta do le-teh. Diplomsko nalogo smo zaključili s smernicami za nadalnji razvoj. Ključne besede: virtualni agent, klepetalnik, ekspertni sistem, procesiranje naravnega jezika Objavljeno v DKUM: 20.05.2014; Ogledov: 1788; Prenosov: 96
Celotno besedilo (1,24 MB) |
5. |
6. SISTEM PRIPOROČANJA DOKUMENTOV IN ANALIZA KVALITETE VSEBINSKEGA PRIPOROČANJA PRI RAZLIČNIH OBDELAVAH VHODNEGA BESEDILAMladen Borovič, 2012, magistrsko delo Opis: V magistrskem delu obravnavamo načrtovanje in razvoj sistemov za vsebinsko priporočanje pomensko sorodnih dokumentov. V teoretičnem delu najprej podamo osnovne značilnosti priporočilnih sistemov. Ker v priporočilnem sistemu obdelujemo besedila v slovenskem jeziku, najprej podamo pregled nekaterih obdelav vhodnega besedila (lematizacija, izločanje pogostih besed in pomensko označevanje). Nato opišemo funkcijo razvrščanja BM25 in pristop z latentno semantično analizo. Sledi podroben opis razvoja priporočilnega sistema, ki je tudi praktični izdelek tega magistrskega dela. V nadaljevanju predstavimo in analiziramo uspešnost vsebinskega priporočanja pri različnih obdelavah vhodnega besedila. Na koncu podamo še nekaj potencialnih izboljšav v smislu pomenskega gručenja, klasifikacije, hibridnega pristopa pri razvrščanju dokumentov in uporabe razvitega sistema v drugih aplikacijah. Ključne besede: priporočilni sistemi, vsebinsko priporočanje dokumentov, funkcija razvrščanja BM25, latentna semantična analiza, beleženje uporabniških aktivnosti, pomensko označevanje, statistične metode, procesiranje naravnega jezika, jezikovne tehnologije Objavljeno v DKUM: 30.11.2012; Ogledov: 3299; Prenosov: 281 (3 glasovi)
Celotno besedilo (2,13 MB) |
7. IZDELAVA PROGRAMSKEGA PAKETA ZA PRIDOBIVANJE IN PRIMERJANJE BESEDIL IZ INTERNETAMatej Petek, 2012, diplomsko delo Opis: V diplomskem delu smo obdelali področje pridobivanja dokumentov iz različnih virov na internetu. V teoretičnem delu smo predstavili, kako delujejo spletni pajki, strežniki OAI-PMH in OAI-ORE ter orodje Appache Tika, ki omogoča pretvorbo različnih vrst dokumentov v tekstovno obliko in ekstrakcijo metapodatkov. Zatem smo na kratko predstavili naloge, ki jih rešujejo sistemi za obdelavo besedil v naravnem jeziku. V praktičnem delu smo izdelali programski paket za pridobivanje dokumentov iz interneta in primerjanje besedil iz teh dokumentov. Ključne besede: procesiranje naravnega jezika, metapodatki, spletni pajki, OAI-PMH, detekcija plagiatov Objavljeno v DKUM: 14.03.2012; Ogledov: 3419; Prenosov: 264
Celotno besedilo (2,57 MB) |
8. PRIMERJAVA RAZLIČNIH ALGORITMOV ZA DOLOČANJE KOLOKACIJ MED BESEDAMIDejan Brodnjak, 2011, diplomsko delo/naloga Opis: Kolokacije so besedne zveze, ki se v besedilih pojavljajo pogosteje kot bi se po naključju. V diplomskem delu bomo spoznali njihov pomen in uporabo pri procesiranju besedil v slovenskem jeziku. Pogledali si bomo tudi korpus jos1M, ki ga bomo uporabljali kot vhod v algoritme za določanje kolokacij. Implementirali bomo dva algoritma za določanje kolokacij (frekvenčni in razpršeni). Z morfološkim filtriranjem bomo izrazili kolokacije. Na koncu bomo algoritma primerjali. Ključne besede: procesiranje naravnega jezika, kolokacije, jos1M korpus Objavljeno v DKUM: 30.09.2011; Ogledov: 1991; Prenosov: 149
Celotno besedilo (1,48 MB) |
9. |
10. SEGMENTACIJA BESEDIL DIPLOMSKIH NALOG IZ DIGITALNE KNJIŽNICE UNIVERZE V MARIBORUMarcel Žerdin, 2011, diplomsko delo/naloga Opis: Diplomsko delo zajema predstavitev načrtovanja in implementacije programske rešitve za segmentiranje diplomskih del iz Digitalne knjižnice Univerze v Mariboru (DKUM). V delu smo najprej opisali področje procesiranja naravnega jezika in ujemanja vzorcev. Zatem smo opisali programsko rešitev. Predstavili smo postopek pridobitve čistega teksta iz dokumentov PDF, nato analizo zgradbe diplomskih nalog in njihovo segmentiranje. Podali smo tudi opis razvojnega okolja ter opisali težave in omejitve, na katere smo naleteli med razvojem programske rešitve. V zaključku smo podali nekaj sklepnih misli o rezultatih in možnostih nadaljnjega dela. Ključne besede: segmentiranje besedila, procesiranje naravnega jezika, ujemanje vzorcev, regularni izrazi Objavljeno v DKUM: 23.09.2011; Ogledov: 2506; Prenosov: 204 (1 glas)
Celotno besedilo (2,29 MB) |