| | SLO | ENG | Cookies and privacy

Bigger font | Smaller font

Search the digital library catalog Help

Query: search in
search in
search in
search in
* old and bologna study programme

Options:
  Reset


11 - 12 / 12
First pagePrevious page12Next pageLast page
11.
Izdelava sistema za določanje geografskega in časovnega pokritja v besedilih
Aleš Pečovnik, 2016, undergraduate thesis

Abstract: V diplomskem delu je opisan celoten postopek izdelave sistema, ki določa geografsko in časovno pokritje besedil. Slednje spada v področje določanja imenskih entitet. Sistem je izdelan s prosto dostopnimi podatkovnimi viri in programskimi rešitvami, zato so v prvem delu opisani ti podatkovni viri, kako so bili njihovi podatki združeni za ustvaritev zemljevida in označevanja entitet. Potem sledi opis uporabljenih orodij in kako so bila uporabljena. Za tem sledi opis postopka označevanja geografskih in časovnih entitet ter na koncu še predstavitev implementacije, delovanja sistema in izgled spletnih strani, uporabljenih za interakcijo z uporabniki. Zastavljeni cilji so bili uresničeni, sistem deluje kot načrtovano in označevanje daje pričakovane rezultate.
Keywords: procesiranje naravnega jezika, določanje imenskih entitet, geografska pokritost, časovna pokritost, določanje pokritosti besedil, Geonames, OpenStreetMap
Published: 06.09.2016; Views: 502; Downloads: 56
.pdf Full text (2,03 MB)

12.
PORAZDELJENA POMENSKA ANALIZA DOKUMENTOV V PROGRAMSKEM OGRODJU APACHE HADOOP
David Starina, 2016, undergraduate thesis

Abstract: V diplomskem delu obravnavamo porazdeljeno pomensko analizo dokumentov v programskem ogrodju Apache Hadoop. Opišemo sestavo in delovanje Hadoopa, predvsem porazdeljenega datotečnega sistema HDFS in pogajalca za vire YARN. Predstavimo različne metode za pomensko analizo besedil, osredotočimo se na linearno Dirichletovo razporeditev (LDA) in podamo različne metrike za ugotavljanje podobnosti med vektorji. Predstavimo implementacijo rešitve za iskanje podobnih dokumentov s pomočjo programske knjižnice Apache Mahout in razpravljamo o primerih z LDA-jem generiranih tem. Predstavimo rezultate meritev na porazdeljeni in ne-porazdeljeni različici in predstavimo nekaj predlogov za hitrejšo analizo.
Keywords: pomenska analiza, porazdeljena obdelava, Hadoop, linearna Dirichletova razporeditev, procesiranje naravnega jezika
Published: 08.09.2016; Views: 507; Downloads: 100
.pdf Full text (1,33 MB)

Search done in 0.05 sec.
Back to top
Logos of partners University of Maribor University of Ljubljana University of Primorska University of Nova Gorica