| | SLO | ENG | Piškotki in zasebnost

Večja pisava | Manjša pisava

Iskanje po katalogu digitalne knjižnice Pomoč

Iskalni niz: išči po
išči po
išči po
išči po
* po starem in bolonjskem študiju

Opcije:
  Ponastavi


1 - 8 / 8
Na začetekNa prejšnjo stran1Na naslednjo stranNa konec
1.
2.
RAZREŠEVANJE VEČPOMENSKOSTI IN ODKRIVANJE USTREZNIH PREDLOG V SISTEMU ZA PRIKLIC INFORMACIJ V NARAVNEM JEZIKU
Albin Bregant, 2011, magistrsko delo

Opis: V magistrskem delu predstavljamo svoj način predstavitve znanja v strukturirani, formalni obliki in način poizvedovanja po tako predstavljenem znanju. Pri obdelavi naravnega jezika smo se osredotočili na neslovnične pristope, brez uporabe slovničnih analiz in korpusov. Predstavljene pristope smo uporabili na sistemu za priklic informacij v naravnem jeziku, kjer uporabniki podajo iskalno zahtevo v naravnem jeziku. Eden izmed osrednjih problemov naravnega jezika je njegova dvoumnost. Če želimo pripraviti ustrezni odgovor, moramo razumeti vprašanje oz. določiti njegov pomen. V pričujočem delu predstavljamo algoritem za razreševanje večpomenskosti in odkrivanje ustreznih predlog, ki nam iz naše baze znanja poišče najustreznejši odgovor.
Ključne besede: razločevanje entitet, razpoznavanje entitet, razreševanje večpomenskosti, obdelava naravnega jezika, sistem za priklic informacij, predstavitev znanja
Objavljeno: 01.07.2011; Ogledov: 1932; Prenosov: 112
.pdf Celotno besedilo (1,49 MB)

3.
GRADNJA SPLOŠNO POMENSKEGA SLOVARJA S POMOČJO WORDNET-A, EUROVOC-A IN DRUGIH STRUKTURIRANIH POMENSKIH VIROV
Uroš Manačinski, 2011, diplomsko delo/naloga

Opis: V diplomskem delu smo predstavili različne pomenske vire, podrobneje smo spoznali WordNet in Eurovoc. V praktičnem delu smo izdelali spletno aplikacijo za gradnjo domensko specifičnih in splošno pomenskih slovarjev in napolnili njeno podatkovno bazo z nekaterimi najpomembnejšimi pomenskimi viri.
Ključne besede: obdelava naravnega jezika, pomenski slovar, tezaver, spletna aplikacija
Objavljeno: 25.09.2011; Ogledov: 1148; Prenosov: 64
.pdf Celotno besedilo (853,59 KB)

4.
VREDNOTENJE METOD STROJNEGA UČENJA Z METODAMI OBDELAVE NARAVNEGA JEZIKA
Sandi Pohorec, 2013, doktorska disertacija

Opis: Vrednotenje metod strojnega učenja se tradicionalno izvaja z oceno delovanja na ročno označeni testni množici. Ta približek uporabljamo preprosto zato, ker nimamo na voljo boljše metode. Moramo se zavedati, da se je metoda strojnega učenja učila iz zelo sorodnih (podobnih) podatkov. Torej so posledično vsa predvidevanja o zmogljivosti na realnih podatkih, ki so ocenjena na podlagi testne množice, optimistična. Dejanska vrednost metode strojnega učenja temelji na njeni sposobnosti tvorjenja dobrih hipotez. Ovrednotenje metod strojnega učenja z obdelavo naravnega jezika vpelje popolnoma nov vir: izsledke znanstvenih raziskav in študij, zapisanih v znanstvenih objavah. Ta vir ponuja objektivno metodo ocenitve rezultatov na podlagi podatkov iz raziskav. V veliki meri zmanjša delo domenskih strokovnjakov, ki je potrebno za ovrednotenje rezultatov strojnega učenja. Hkrati je tak pristop zmožen tvoriti enciklopedično zbirko formaliziranega znanja, ki je splošno uporabna.
Ključne besede: strojno učenje, podatkovno rudarjenje, verifikacija in validacija, obdelava naravnega jezika
Objavljeno: 17.04.2013; Ogledov: 1529; Prenosov: 241
.pdf Celotno besedilo (7,86 MB)

5.
Razvoj modela za inteligentno podporo odločanju na osnovi analize nesktrukturiranih vsebin
Miha Pavlinek, 2016, doktorska disertacija

Opis: V svetu vseprisotnega računalništva se s kopičenjem naprav ter množično uporabo družbenih omrežij, elektronske komunikacije in drugih oblik IKT storitev naglo povečuje tudi količina nestrukturiranih vsebin. To nas sili k uporabi inteligentnih rešitev, ki za nas te vsebine organizirajo, se namesto nas odločajo o njihovi pomembnosti in nam posredujejo zgolj najbolj relevantne med njimi. Osnovna zmožnost takšnih rešitev je klasifikacija vsebin, zato so v njih avtomatski klasifikatorji nepogrešljiv člen. Zanje je tipično, da za učenje potrebujejo številne označene primerke z ustrezno predstavitvijo, v praksi pa označeni primerki niso vedno na voljo, zato je potrebno avtomatske klasifikatorje prilagoditi tako, da so sposobni pri učenju uporabljati tudi druge, neoznačene vsebine. V disertaciji smo predstavili metodo ST LDA (ang. Self-Training with LDA) za klasifikacijo besedil, ki za učenje klasifikatorja potrebuje le minimalno množico označenih in veliko večjo množico neoznačenih primerkov. Predlagali smo algoritem, ki temelji na metodi samoučenja ter predstavitvi besedil na osnovi tematskega modela, kar prinaša dodatne faktorje, od katerih je odvisna njegova uspešnost. Za vsak faktor smo, na podlagi številnih eksperimentov nad sedmimi besedilnimi podatkovnimi zbirkami, ocenili vpliv na uspešnost klasifikacije ter definirali model za določanje vrednosti parametrov, s čimer se izognemo dodatnim nastavitvam. Uspešnost metode smo primerjali z uspešnostjo drugih uveljavljenih metod in predstavitev, pri čemer predlagana metoda ST LDA dosega nadpovprečne rezultate, kar smo navsezadnje potrdili z neparametričnimi statističnimi testi.
Ključne besede: obdelava naravnega jezika, tekstovno rudarjenje, klasifikacija, tematsko modeliranje, delno nadzorovano učenje, samoučenje
Objavljeno: 16.09.2016; Ogledov: 791; Prenosov: 94
.pdf Celotno besedilo (4,13 MB)

6.
PORAZDELJENA POMENSKA ANALIZA DOKUMENTOV V PROGRAMSKEM OGRODJU APACHE HADOOP
David Starina, 2016, diplomsko delo

Opis: V diplomskem delu obravnavamo porazdeljeno pomensko analizo dokumentov v programskem ogrodju Apache Hadoop. Opišemo sestavo in delovanje Hadoopa, predvsem porazdeljenega datotečnega sistema HDFS in pogajalca za vire YARN. Predstavimo različne metode za pomensko analizo besedil, osredotočimo se na linearno Dirichletovo razporeditev (LDA) in podamo različne metrike za ugotavljanje podobnosti med vektorji. Predstavimo implementacijo rešitve za iskanje podobnih dokumentov s pomočjo programske knjižnice Apache Mahout in razpravljamo o primerih z LDA-jem generiranih tem. Predstavimo rezultate meritev na porazdeljeni in ne-porazdeljeni različici in predstavimo nekaj predlogov za hitrejšo analizo.
Ključne besede: pomenska analiza, porazdeljena obdelava, Hadoop, linearna Dirichletova razporeditev, procesiranje naravnega jezika
Objavljeno: 08.09.2016; Ogledov: 452; Prenosov: 99
.pdf Celotno besedilo (1,33 MB)

7.
Uporaba metod strojnega učenja za označevanje imenskih entitet v besedilih
Aleš Pečovnik, 2019, magistrsko delo

Opis: V magistrskem delu je opisano področje označevanja imenskih entitet vključno z razpoložljivimi pristopi. Podrobneje je razdelano področje strojnega učenja, tako nadzorovanega, delno nadzorovanega kot nenadzorovanega, z opisi nekaj pogosto uporabljanih metod. V magistrskem delu smo izdelali in preizkusili sistem označevanja imenskih entitet v besedilih, ki so napisana v slovenskem jeziku. Uporabili smo strojno učenje z metodo pogojnih naključnih polj. Opisani so posamezni deli sistema, uporabljen podatkovni vir za učenje sistema, za tem pa sam potek preizkušanja in dobljeni rezultati ter ugotovitve. Rezultati za kategoriji geografskih in lastnih imen so bili zadovoljivi, obstajajo pa še razne možnosti za nadaljnji napredek na tem področju, ki je tudi nujen zaradi naraščajočih potreb po uporabi takšnih sistemov.
Ključne besede: obdelava naravnega jezika, strojno učenje, označevanje imenskih entitet, pogojna naključna polja
Objavljeno: 30.01.2019; Ogledov: 258; Prenosov: 47
.pdf Celotno besedilo (1,38 MB)

8.
Razpoznavanje in klasifikacija imenskih entitet z uporabo umetnih nevronskih mrež
Luka Bašek, 2019, magistrsko delo

Opis: Z razvojem področja globokega učenja, ki temelji na umetnih nevronskih mrežah, se danes poskušajo rešiti že znani problemi področja obdelave naravnega jezika. V tem magistrskem delu obravnavamo problem razpoznavanja in klasifikacije imenskih entitet z uporabo metod globokega učenja. V magistrski nalogi smo uporabili programski jezik Python in odprtokodno knjižnico Keras. Preizkusili smo različne arhitekture rekurentnih nevronskih mrež, ki uporabljajo pomnilne celice LSTM in GRU. Prav tako smo opravili različne poskuse, v katerih smo iskali optimalne parametre nevronske mreže z namenom natančnega razpoznavanja in klasifikacije imenskih entitet. Učenje nevronske mreže in vrednotenje modelov smo izvedli na korpusih, ki so bili predstavljeni na konferenci CONLL leta 2003.
Ključne besede: obdelava naravnega jezika, razpoznavanje imenskih entitet, umetne nevronske mreže, LSTM, GRU
Objavljeno: 14.02.2019; Ogledov: 199; Prenosov: 52
.pdf Celotno besedilo (4,85 MB)

Iskanje izvedeno v 0.25 sek.
Na vrh
Logotipi partnerjev Univerza v Mariboru Univerza v Ljubljani Univerza na Primorskem Univerza v Novi Gorici