| | SLO | ENG | Piškotki in zasebnost

Večja pisava | Manjša pisava

Izpis gradiva

Naslov:Relevantnost informacijskega priklica pri strojnem učenju za binarno besedilno klasifikacijo
Avtorji:Marijan, Robert (Avtor)
Leskovar, Robert (Mentor) Več o mentorju... Novo okno
Datoteke:.pdf DOK_Marijan_Robert_2019.pdf (6,50 MB)
MD5: 7C3EDD46F0FDE6B4874A6557AB3BF5C7
 
Jezik:Slovenski jezik
Vrsta gradiva:Doktorsko delo/naloga (mb31)
Organizacija:FOV - Fakulteta za organizacijske vede
Opis:Raziskava obravnava relevantnost v procesih informacijskega priklica oziroma iskanja in prenosa informacij pri algoritmih strojnega učenja za binarno klasifikacijo besedilnih primerkov. Predstavljena je metodologija dela z opisom problema in okolja, metod, orodij in podatkov raziskovanja, ter hipotezi. Izvedli smo pojmovno razgradnjo gradnikov disertacije: agent, informacijska znanost, iskanje in prenos informacij, klasifikacija, komunikacija, podatkovno rudarjenje in prepoznavanje vzorcev, povezave, reševanje problemov, hevristika in intuicija, strojno učenje, svet, umetna inteligenca, umetne nevronske mreže, znanje. Pri ključnem pojmu raziskave, relevantnosti, smo opredelili njegov izvor, izhodiščne definicije, opredelitve pojma kot povezave, ter predstavili tri modele: Mizzarov model štirih dimenzij relevantnosti, Dervinino sense-making teorijo, ter Greisdorfov konjunktivno-disjunktivni model. Proučili smo stopnje relevantnosti in zadostnost dokazov, tipe relevantnosti, pogoje za relevantnost, predpostavke in uporabnikove izbore konteksta ter sodbe relevantnosti. Izvedli smo dve skupini eksperimentov, v katerih smo (1) merili učinkovitost iskanja in prenosa informacij, in (2) analizirali dejavnike, ki vplivajo na učinkovitost iskanja in prenosa informacij: vpliv naključja, vpliv števila atributov, vpliv števila primerkov in tipa vektorizacije, vpliv izbora algoritmov strojnega učenja, vpliv izbora atributov z razredno napovednimi lastnostmi, vpliv lematizacije, vpliv razredne neenakosti, vpliv učinka pretiranega prilagajanja modela podatkom. V disertaciji smo testirali hipotezi zamenjave (kognitivnih) sodb relevantnosti človeških ekspertov z računalniško ustvarjenimi. Z uporabo odprtokodnih in brezplačno dostopnih programskih orodij smo s postopki podatkovnega rudarjenja in algoritmi strojnega učenja merili učinkovitost iskanja in prenosa informacij agenta z zaznano informacijsko potrebo. Korenski pojem relevantnosti smo analizirali s sistemsko in uporabniško usmerjenim pristopom. Izvedli smo dve skupini eksperimentov, ter dokazali, da lahko ob danih predpostavkah odprtokodna programska orodja (tako delno kot v celoti) nadomestijo človeškega eksperta kot ocenjevalca v postopkih binarne klasifikacije relevantnosti. Založniki lahko, v primeru uporabe dokumentacijskih oziroma knjižničnih informacijskih sistemov, ki tehnično in pravno omogočajo modularno nadgrajevanje, zamenjajo programske module iskanja in prenosa informacij z odprtokodnimi orodji strojnega učenja, ki so bili predmet disertacije, in s tem začnejo postopek uporabe le-teh kot nadomestilo ali dopolnilo človeškim sodbam v postopkih binarne klasifikacije besedilnih primerkov.
Ključne besede:Relevantnost, iskanje in prenos informacij, strojno učenje
Leto izida:2019
Izvor:Maribor
COBISS_ID:302092032 Novo okno
NUK URN:URN:SI:UM:DK:0N1SK0LB
Število ogledov:572
Število prenosov:45
Metapodatki:XML RDF-CHPDL DC-XML DC-RDF
Področja:FOV
:
  
Skupna ocena:(0 glasov)
Vaša ocena:Ocenjevanje je dovoljeno samo prijavljenim uporabnikom.
Objavi na:AddThis
AddThis uporablja piškotke, za katere potrebujemo vaše privoljenje.
Uredi privoljenje...

Postavite miškin kazalec na naslov za izpis povzetka. Klik na naslov izpiše podrobnosti ali sproži prenos.

Licence

Licenca:CC BY-NC-ND 4.0, Creative Commons Priznanje avtorstva-Nekomercialno-Brez predelav 4.0 Mednarodna
Povezava:http://creativecommons.org/licenses/by-nc-nd/4.0/deed.sl
Opis:Najbolj omejujoča licenca Creative Commons. Uporabniki lahko prenesejo in delijo delo v nekomercialne namene in ga ne smejo uporabiti za nobene druge namene.
Začetek licenciranja:13.01.2019

Sekundarni jezik

Jezik:Angleški jezik
Naslov:Relevance of information retrieval in machine learning binary text classification
Opis:In research we studied the notion of relevance in the field of information retrieval using the machine learning algorithms for binary text classification. We described the methodology, used in research, which included definition of problem and environment, methods, tools and research data, and hypothesis. We analyzed building blocks of dissertation, which included the notions of agent, information science, information retrieval, classification, communication, data mining and pattern recognition, relations, problem solving, heuristics and intuition, machine learning, world, artificial intelligence, artificial neural networks and knowledge. For the key research notion, relevance, we defined concept’s origin and basic definitions. We analyzed different relevance models, including Mizzaro’s four dimensions of relevance, Dervin’s sense-making theory and Greisdorf’s conjunctive/disjunctive model. We studied the levels, types and conditions of relevance, premises and user’s context selection and relevance judgments. We conducted two sets of experiments, where we (1) measured the performance of information retrieval and (2) analyzed the factors that influence the performance of information retrieval: the number of attributes, text records, types of vectorization, selection of machine learning algorithms, selection of attributes with predictive properties, the impact of selected lemmatization and others. In dissertation we tested the hypothesis of replacing cognitive relevance judgments, created by human experts, with relevance judgments, created solely by computer algorithms. We were measuring the performance of information retrieval in order to satisfy agent’s perceived information need using open source and freely available data mining procedures and machine learning algorithms. We analyzed the root notion of relevance using systems-centered and user-centered approach. We conducted the number of experiments and showed that in comply with certain premises open source software can (fully and in part) substitute the human expert as a gold standard creator. Publishers can, if their integrated library systems technically and legally allow, replace parts of ILS with open source software modules for information retrieval, discussed in this dissertation, as s step towards replacing human experts with machine learning algorithms performing tasks of binary text classification.
Ključne besede:Relevance, information retrieval, machine learning


Komentarji

Dodaj komentar

Za komentiranje se morate prijaviti.

Komentarji (0)
0 - 0 / 0
 
Ni komentarjev!

Nazaj
Logotipi partnerjev Univerza v Mariboru Univerza v Ljubljani Univerza na Primorskem Univerza v Novi Gorici