| | SLO | ENG | Cookies and privacy

Bigger font | Smaller font

Search the digital library catalog Help

Query: search in
search in
search in
search in
* old and bologna study programme

Options:
  Reset


1 - 1 / 1
First pagePrevious page1Next pageLast page
1.
Relevantnost informacijskega priklica pri strojnem učenju za binarno besedilno klasifikacijo
Robert Marijan, 2019, doctoral dissertation

Abstract: Raziskava obravnava relevantnost v procesih informacijskega priklica oziroma iskanja in prenosa informacij pri algoritmih strojnega učenja za binarno klasifikacijo besedilnih primerkov. Predstavljena je metodologija dela z opisom problema in okolja, metod, orodij in podatkov raziskovanja, ter hipotezi. Izvedli smo pojmovno razgradnjo gradnikov disertacije: agent, informacijska znanost, iskanje in prenos informacij, klasifikacija, komunikacija, podatkovno rudarjenje in prepoznavanje vzorcev, povezave, reševanje problemov, hevristika in intuicija, strojno učenje, svet, umetna inteligenca, umetne nevronske mreže, znanje. Pri ključnem pojmu raziskave, relevantnosti, smo opredelili njegov izvor, izhodiščne definicije, opredelitve pojma kot povezave, ter predstavili tri modele: Mizzarov model štirih dimenzij relevantnosti, Dervinino sense-making teorijo, ter Greisdorfov konjunktivno-disjunktivni model. Proučili smo stopnje relevantnosti in zadostnost dokazov, tipe relevantnosti, pogoje za relevantnost, predpostavke in uporabnikove izbore konteksta ter sodbe relevantnosti. Izvedli smo dve skupini eksperimentov, v katerih smo (1) merili učinkovitost iskanja in prenosa informacij, in (2) analizirali dejavnike, ki vplivajo na učinkovitost iskanja in prenosa informacij: vpliv naključja, vpliv števila atributov, vpliv števila primerkov in tipa vektorizacije, vpliv izbora algoritmov strojnega učenja, vpliv izbora atributov z razredno napovednimi lastnostmi, vpliv lematizacije, vpliv razredne neenakosti, vpliv učinka pretiranega prilagajanja modela podatkom. V disertaciji smo testirali hipotezi zamenjave (kognitivnih) sodb relevantnosti človeških ekspertov z računalniško ustvarjenimi. Z uporabo odprtokodnih in brezplačno dostopnih programskih orodij smo s postopki podatkovnega rudarjenja in algoritmi strojnega učenja merili učinkovitost iskanja in prenosa informacij agenta z zaznano informacijsko potrebo. Korenski pojem relevantnosti smo analizirali s sistemsko in uporabniško usmerjenim pristopom. Izvedli smo dve skupini eksperimentov, ter dokazali, da lahko ob danih predpostavkah odprtokodna programska orodja (tako delno kot v celoti) nadomestijo človeškega eksperta kot ocenjevalca v postopkih binarne klasifikacije relevantnosti. Založniki lahko, v primeru uporabe dokumentacijskih oziroma knjižničnih informacijskih sistemov, ki tehnično in pravno omogočajo modularno nadgrajevanje, zamenjajo programske module iskanja in prenosa informacij z odprtokodnimi orodji strojnega učenja, ki so bili predmet disertacije, in s tem začnejo postopek uporabe le-teh kot nadomestilo ali dopolnilo človeškim sodbam v postopkih binarne klasifikacije besedilnih primerkov.
Keywords: Relevantnost, iskanje in prenos informacij, strojno učenje
Published: 20.01.2020; Views: 64; Downloads: 5
.pdf Full text (6,50 MB)

Search done in 0.03 sec.
Back to top
Logos of partners University of Maribor University of Ljubljana University of Primorska University of Nova Gorica