| | SLO | ENG | Cookies and privacy

Bigger font | Smaller font

Search the digital library catalog Help

Query: search in
search in
search in
search in
* old and bologna study programme

Options:
  Reset


1 - 10 / 12
First pagePrevious page12Next pageLast page
1.
PORAZDELJENA POMENSKA ANALIZA DOKUMENTOV V PROGRAMSKEM OGRODJU APACHE HADOOP
David Starina, 2016, undergraduate thesis

Abstract: V diplomskem delu obravnavamo porazdeljeno pomensko analizo dokumentov v programskem ogrodju Apache Hadoop. Opišemo sestavo in delovanje Hadoopa, predvsem porazdeljenega datotečnega sistema HDFS in pogajalca za vire YARN. Predstavimo različne metode za pomensko analizo besedil, osredotočimo se na linearno Dirichletovo razporeditev (LDA) in podamo različne metrike za ugotavljanje podobnosti med vektorji. Predstavimo implementacijo rešitve za iskanje podobnih dokumentov s pomočjo programske knjižnice Apache Mahout in razpravljamo o primerih z LDA-jem generiranih tem. Predstavimo rezultate meritev na porazdeljeni in ne-porazdeljeni različici in predstavimo nekaj predlogov za hitrejšo analizo.
Keywords: pomenska analiza, porazdeljena obdelava, Hadoop, linearna Dirichletova razporeditev, procesiranje naravnega jezika
Published: 08.09.2016; Views: 813; Downloads: 130
.pdf Full text (1,33 MB)

2.
Izdelava sistema za določanje geografskega in časovnega pokritja v besedilih
Aleš Pečovnik, 2016, undergraduate thesis

Abstract: V diplomskem delu je opisan celoten postopek izdelave sistema, ki določa geografsko in časovno pokritje besedil. Slednje spada v področje določanja imenskih entitet. Sistem je izdelan s prosto dostopnimi podatkovnimi viri in programskimi rešitvami, zato so v prvem delu opisani ti podatkovni viri, kako so bili njihovi podatki združeni za ustvaritev zemljevida in označevanja entitet. Potem sledi opis uporabljenih orodij in kako so bila uporabljena. Za tem sledi opis postopka označevanja geografskih in časovnih entitet ter na koncu še predstavitev implementacije, delovanja sistema in izgled spletnih strani, uporabljenih za interakcijo z uporabniki. Zastavljeni cilji so bili uresničeni, sistem deluje kot načrtovano in označevanje daje pričakovane rezultate.
Keywords: procesiranje naravnega jezika, določanje imenskih entitet, geografska pokritost, časovna pokritost, določanje pokritosti besedil, Geonames, OpenStreetMap
Published: 06.09.2016; Views: 755; Downloads: 77
.pdf Full text (2,03 MB)

3.
IMPLEMENTACIJA VIRTUALNEGA AGENTA Z ODPRTO-KODNO REŠITVIJO VERBOT ENGINE
David Kolarič, 2014, undergraduate thesis

Abstract: Pričujoče diplomsko delo temelji na raziskavi virtualnih agentov in uporabi ogrodij za vzpostavitev le-teh. Predstavljen je primer implementacije virtualnega agenta. Sprva smo povzeli že znana teoretična izhodišča. Predstavili smo tri referenčne primere, ter podali različna ogrodja za vzpostavitev virtualnih agentov in jih analizirali. S tem smo se nato odločili za ogrodje, ki smo ga uporabili za vzpostavitev našega virtualnega agenta. Nadalje smo pogledali ekspertne sisteme in procesiranje naravnega jezika, ter uporabo regularnih izrazov v programskem jeziku C#. Predstavili smo rešitev Verbot engine 5, s katero smo izdelali virtualnega agenta, ki uporabniku omogoča hitro pridobivanje informacij o filmih, ki se predvajajo v slovenskih kinematografih. Pri tem smo se omejili na kinematografe Planet Tuš in Kolosej. Prikazali smo pridobivanje in shranjevanje podatkov, ter dostop virtualnega agenta do le-teh. Diplomsko nalogo smo zaključili s smernicami za nadalnji razvoj.
Keywords: virtualni agent, klepetalnik, ekspertni sistem, procesiranje naravnega jezika
Published: 20.05.2014; Views: 1049; Downloads: 77
.pdf Full text (1,24 MB)

4.
STATISTIČNA OBDELAVA PODATKOV O PODOBNIH DELIH NA INTERNETU
Alen Merc, 2013, undergraduate thesis

Abstract: V diplomskem delu najprej predstavimo pojem plagiatorstva. Osredotočimo se na njegove značilnosti, kako ga odkrivamo ter kako ga preprečimo. Pojem plagiatorstva prav tako poskusimo opredeliti iz pravnega, kulturnega in etičnega vidika. Posebno poglavje je namenjeno kratkemu opisu opreme za odkrivanje plagiatov v besedilih. Iz nacionalnega portala odprte znanosti in drugih virov smo s pomočjo programa za odkrivanje podobnosti v besedilih ugotavljali podobnosti med posameznimi deli slovenskih univerz. Rezultate te obdelave smo podali v praktičnem delu diplomskega dela.
Keywords: plagiatorstvo, statistične metode, sistemi za detekcijo plagiatov, procesiranje naravnega jezika
Published: 03.01.2014; Views: 1104; Downloads: 134
.pdf Full text (5,39 MB)

5.
SISTEM PRIPOROČANJA DOKUMENTOV IN ANALIZA KVALITETE VSEBINSKEGA PRIPOROČANJA PRI RAZLIČNIH OBDELAVAH VHODNEGA BESEDILA
Mladen Borovič, 2012, master's thesis

Abstract: V magistrskem delu obravnavamo načrtovanje in razvoj sistemov za vsebinsko priporočanje pomensko sorodnih dokumentov. V teoretičnem delu najprej podamo osnovne značilnosti priporočilnih sistemov. Ker v priporočilnem sistemu obdelujemo besedila v slovenskem jeziku, najprej podamo pregled nekaterih obdelav vhodnega besedila (lematizacija, izločanje pogostih besed in pomensko označevanje). Nato opišemo funkcijo razvrščanja BM25 in pristop z latentno semantično analizo. Sledi podroben opis razvoja priporočilnega sistema, ki je tudi praktični izdelek tega magistrskega dela. V nadaljevanju predstavimo in analiziramo uspešnost vsebinskega priporočanja pri različnih obdelavah vhodnega besedila. Na koncu podamo še nekaj potencialnih izboljšav v smislu pomenskega gručenja, klasifikacije, hibridnega pristopa pri razvrščanju dokumentov in uporabe razvitega sistema v drugih aplikacijah.
Keywords: priporočilni sistemi, vsebinsko priporočanje dokumentov, funkcija razvrščanja BM25, latentna semantična analiza, beleženje uporabniških aktivnosti, pomensko označevanje, statistične metode, procesiranje naravnega jezika, jezikovne tehnologije
Published: 30.11.2012; Views: 2484; Downloads: 238 
(3 votes)
.pdf Full text (2,13 MB)

6.
IZDELAVA PROGRAMSKEGA PAKETA ZA PRIDOBIVANJE IN PRIMERJANJE BESEDIL IZ INTERNETA
Matej Petek, 2012, undergraduate thesis

Abstract: V diplomskem delu smo obdelali področje pridobivanja dokumentov iz različnih virov na internetu. V teoretičnem delu smo predstavili, kako delujejo spletni pajki, strežniki OAI-PMH in OAI-ORE ter orodje Appache Tika, ki omogoča pretvorbo različnih vrst dokumentov v tekstovno obliko in ekstrakcijo metapodatkov. Zatem smo na kratko predstavili naloge, ki jih rešujejo sistemi za obdelavo besedil v naravnem jeziku. V praktičnem delu smo izdelali programski paket za pridobivanje dokumentov iz interneta in primerjanje besedil iz teh dokumentov.
Keywords: procesiranje naravnega jezika, metapodatki, spletni pajki, OAI-PMH, detekcija plagiatov
Published: 14.03.2012; Views: 2820; Downloads: 203
.pdf Full text (2,57 MB)

7.
PRIMERJAVA RAZLIČNIH ALGORITMOV ZA DOLOČANJE KOLOKACIJ MED BESEDAMI
Dejan Brodnjak, 2011, bachelor thesis/paper

Abstract: Kolokacije so besedne zveze, ki se v besedilih pojavljajo pogosteje kot bi se po naključju. V diplomskem delu bomo spoznali njihov pomen in uporabo pri procesiranju besedil v slovenskem jeziku. Pogledali si bomo tudi korpus jos1M, ki ga bomo uporabljali kot vhod v algoritme za določanje kolokacij. Implementirali bomo dva algoritma za določanje kolokacij (frekvenčni in razpršeni). Z morfološkim filtriranjem bomo izrazili kolokacije. Na koncu bomo algoritma primerjali.
Keywords: procesiranje naravnega jezika, kolokacije, jos1M korpus
Published: 30.09.2011; Views: 1485; Downloads: 100
.pdf Full text (1,48 MB)

8.
WIKIFIKACIJA VSEBIN V DIGITALNI KNJIŽNICI UM
Marko Burjek, 2011, bachelor thesis/paper

Abstract: V diplomskem delu smo raziskovali področje pomenskega označevanja besedila v slovenskem jeziku. Najprej smo opisali obstoječa pomenska označevalnika Wikipedija miner in DBpedija Spotlight. V praktičnem delu smo izdelali lasten pomenski označevalnik za pomensko označevanje v slovenskem jeziku. Rezultate pomenskega označevanja smo primerjali s prej opisanimi označevalniki
Keywords: Wikipedija, DBpedija, pomenski splet, procesiranje naravnega jezika, pomensko označevanje besedila
Published: 25.09.2011; Views: 2495; Downloads: 131
.pdf Full text (2,70 MB)

9.
SEGMENTACIJA BESEDIL DIPLOMSKIH NALOG IZ DIGITALNE KNJIŽNICE UNIVERZE V MARIBORU
Marcel Žerdin, 2011, bachelor thesis/paper

Abstract: Diplomsko delo zajema predstavitev načrtovanja in implementacije programske rešitve za segmentiranje diplomskih del iz Digitalne knjižnice Univerze v Mariboru (DKUM). V delu smo najprej opisali področje procesiranja naravnega jezika in ujemanja vzorcev. Zatem smo opisali programsko rešitev. Predstavili smo postopek pridobitve čistega teksta iz dokumentov PDF, nato analizo zgradbe diplomskih nalog in njihovo segmentiranje. Podali smo tudi opis razvojnega okolja ter opisali težave in omejitve, na katere smo naleteli med razvojem programske rešitve. V zaključku smo podali nekaj sklepnih misli o rezultatih in možnostih nadaljnjega dela.
Keywords: segmentiranje besedila, procesiranje naravnega jezika, ujemanje vzorcev, regularni izrazi
Published: 23.09.2011; Views: 2020; Downloads: 167 
(1 vote)
.pdf Full text (2,29 MB)

10.
Izdelava oblikoslovnega označevalnika za slovenski jezik in primerjava z drugimi rešitvami
Goran Hrovat, 2010, undergraduate thesis

Abstract: V diplomskem delu smo se ukvarjali s področjem računalniško podprtega oblikoslovnega označevanja besedil v slovenskem jeziku. Najprej smo opisali napogostejše probleme, ki se pojavljajo. Nato smo opisali delovanje dveh odprtokodnih oblikoslovnih ozna čevalnikov: Stanford POS Tagger in TreeTagger. V praktičnem delu smo izdelali lastni oblikoslovni ozna čevalnik in prilagodili odprtokodna ozna čevalnika za procesiranje besedil v slovenskem jeziku. Učno mno žico je predstavljal korpus FidaPlus. Rezultate oblikoslovnega označevanja iz vseh treh označevalnikov smo med seboj primerjali.
Keywords: oblikoslovno označevanje, procesiranje naravnega jezika, NLP, naravni jezik, slovenski jezik, lematizacija
Published: 21.06.2010; Views: 2623; Downloads: 186
.pdf Full text (1,68 MB)

Search done in 0.21 sec.
Back to top
Logos of partners University of Maribor University of Ljubljana University of Primorska University of Nova Gorica