1. Relevantnost informacijskega priklica pri strojnem učenju za binarno besedilno klasifikacijoRobert Marijan, 2019, doktorsko delo/naloga Opis: Raziskava obravnava relevantnost v procesih informacijskega priklica oziroma iskanja in prenosa informacij pri algoritmih strojnega učenja za binarno klasifikacijo besedilnih primerkov. Predstavljena je metodologija dela z opisom problema in okolja, metod, orodij in podatkov raziskovanja, ter hipotezi. Izvedli smo pojmovno razgradnjo gradnikov disertacije: agent, informacijska znanost, iskanje in prenos informacij, klasifikacija, komunikacija, podatkovno rudarjenje in prepoznavanje vzorcev, povezave, reševanje problemov, hevristika in intuicija, strojno učenje, svet, umetna inteligenca, umetne nevronske mreže, znanje.
Pri ključnem pojmu raziskave, relevantnosti, smo opredelili njegov izvor, izhodiščne definicije, opredelitve pojma kot povezave, ter predstavili tri modele: Mizzarov model štirih dimenzij relevantnosti, Dervinino sense-making teorijo, ter Greisdorfov konjunktivno-disjunktivni model. Proučili smo stopnje relevantnosti in zadostnost dokazov, tipe relevantnosti, pogoje za relevantnost, predpostavke in uporabnikove izbore konteksta ter sodbe relevantnosti.
Izvedli smo dve skupini eksperimentov, v katerih smo (1) merili učinkovitost iskanja in prenosa informacij, in (2) analizirali dejavnike, ki vplivajo na učinkovitost iskanja in prenosa informacij: vpliv naključja, vpliv števila atributov, vpliv števila primerkov in tipa vektorizacije, vpliv izbora algoritmov strojnega učenja, vpliv izbora atributov z razredno napovednimi lastnostmi, vpliv lematizacije, vpliv razredne neenakosti, vpliv učinka pretiranega prilagajanja modela podatkom.
V disertaciji smo testirali hipotezi zamenjave (kognitivnih) sodb relevantnosti človeških ekspertov z računalniško ustvarjenimi. Z uporabo odprtokodnih in brezplačno dostopnih programskih orodij smo s postopki podatkovnega rudarjenja in algoritmi strojnega učenja merili učinkovitost iskanja in prenosa informacij agenta z zaznano informacijsko potrebo. Korenski pojem relevantnosti smo analizirali s sistemsko in uporabniško usmerjenim pristopom. Izvedli smo dve skupini eksperimentov, ter dokazali, da lahko ob danih predpostavkah odprtokodna programska orodja (tako delno kot v celoti) nadomestijo človeškega eksperta kot ocenjevalca v postopkih binarne klasifikacije relevantnosti. Založniki lahko, v primeru uporabe dokumentacijskih oziroma knjižničnih informacijskih sistemov, ki tehnično in pravno omogočajo modularno nadgrajevanje, zamenjajo programske module iskanja in prenosa informacij z odprtokodnimi orodji strojnega učenja, ki so bili predmet disertacije, in s tem začnejo postopek uporabe le-teh kot nadomestilo ali dopolnilo človeškim sodbam v postopkih binarne klasifikacije besedilnih primerkov. Ključne besede: Relevantnost, iskanje in prenos informacij, strojno učenje Objavljeno v DKUM: 20.01.2020; Ogledov: 1231; Prenosov: 79
Celotno besedilo (6,50 MB) |
2. Iskanje informacij po horizontalno porazdeljenih virihSandi Pohorec, Milan Zorman, 2009, izvirni znanstveni članek Opis: Uporaba spletnih iskalnikov je postala vsakodnevna stalnica. Pogosto so spletni iskalniki edini način iskanja informacij. Spletnim mestom, ki želijo svojim uporabnikom ponuditi napredne iskalne storitve, pogosto ne zadostuje uporaba storitev večjih iskalnikov (Google, Yahoo, Live Search). Razlogi za izgradnjo lastnih iskalnih storitev so predvsem v varnosti, želeni ravni poosebitve ter seveda v potrebi po prilagojenem ocenjevanju in razvrščanju rezultatov. Prispevek predstavi delovanje sodobnih iskalnikov in podrobneje opiše iskalno storitev, ki je bila razvita z vidika posameznega spletnega mesta. Iskalni zadetki se avtomatsko prilagajajo uporabniku in njegovim pravicam, ponujeno pa je tudi iskanje po sorodnih spletnih mestih ter strukturiranih in nestrukturiranih virih podatkov. Iskalna storitev ponuja prav tako poosebljanje iskalnih rezultatov glede na interesna področja uporabnika. Ključne besede: spletni iskalniki, iskanje informacij, spletna mesta, iskalna storitev, iskalni indeksi, spletni pajki, porazdeljeni viri Objavljeno v DKUM: 10.07.2015; Ogledov: 1221; Prenosov: 32
Povezava na celotno besedilo |
3. |
4. |
5. KLASIFIKACIJA SPLETNIH NOVIC S POMOČJO METOD PODATKOVNEGA RUDARJENJA V BESEDILUMitja Sandić, 2012, diplomsko delo Opis: Pogosto uporabniki interneta dobijo rezultat iskanja, ki vsebuje širok spekter dokumentov, a le nekaj je teh, ki so pomembni za njihove potrebe po informacijah. Za reševanje tega problema vedno več sistemov iskano informacijo organizira po ključu, ki je vsebinsko povezan s podatki. Poglejmo dva glavna avtomatska pristopa k organizaciji informacij: interaktivno povezovanje rezultatov iskanja (angl. clustering) in predkategoriziranje dokumentov, kjer zagotovimo hierarhično strukturo iskanja. Oba pristopa zahtevata v realnem svetu aplikacij učinkovite algoritme, ki se ubadajo s problematiko predstavitev dokumentov s sto ali več tisoč besedami. Problem se pojavi v tem, kako analizirati in obdelati takšno količino podatkov. V diplomskem delu bomo predstavili, kako dokumente pravilno pripraviti (zmanjšati vsebino dokumentov), ne da bi pri tem negativno vplivali na samo klasifikacijo. Poleg tega pa, kako z dodatnimi parametri zagotoviti še boljšo klasifikacijo. Ključne besede: podatkovno rudarjenje v besedilih, klasifikacija, iskanje informacij. Objavljeno v DKUM: 12.06.2012; Ogledov: 1572; Prenosov: 234
Celotno besedilo (2,81 MB) |
6. |
7. SVETOVNI SPLET KOT MEDIJ ZA POMOČ MEDICINSKI SESTRINatalija Štelcl, 2011, diplomsko delo Opis: Od sredine devetdesetih let se je uporaba svetovnega spleta med posamezniki zelo razširila. V njegovih začetkih konec šestdesetih, ko je nastal iz računalniškega programa, ki ga je sofinanciralo ameriško obrambno ministrstvo, je imel dostop do spleta le malokdo. Danes je dostopen več kot četrtini svetovnega in več kot polovici evropskega prebivalstva. Na tem informacijskem velikanu se nahaja neizmerljiva količina informacij. Vse novosti se na spletu pojavijo precej hitreje kot v tiskanih medijih (knjige, revije) in drugih medijih (televizija, radio), predvsem zaradi očitnih prednosti kot so enostavnejša priprava in objava v nasprotju z ostalimi mediji, kjer je potrebnega več časa za urejanje, tiskanje in distribucijo.
Ker je svetovni splet splošno dostopen, informacije večinoma zelo ažurne in verodostojne in ker se nanj lahko dostopa praktično od vsepovsod, je lahko v veliko pomoč tudi medicinski sestri. V pomoč so ji lahko spletne strani, namenjene širšemu krogu obiskovalcev ali pa ožje specializirane strani, kjer so informacije namenjene določenemu krogu uporabnikov in jih najdemo na spletnih straneh raznih knjižnic, v obliki člankov in raziskav. Nekaj teh spletnih strani smo v diplomskem delu tudi bolj podrobno raziskali. Zadnjih nekaj let so se pričele pojavljati spletne strani novejše generacije, tako imenovane »Web 2.0« spletne strani. Te spletne strani temeljijo na socialnih stikih, torej na povezovanju med posamezniki in novejših tehnologijah prikazovanja in obdelovanja informacij. Danes določen delež medicinskih sester uporablja ta spletna mesta za pridobivanje in posredovanje znanja, povezovanje, medsebojno komunikacijo, izmenjavo izkušenj in tudi socialne stike.
V diplomskem delu smo podrobneje raziskali, kako dobro medicinske sestre poznajo spletne strani druge generacije, ali omenjene spletne strani uporabljajo in v kakšni meri v njih aktivno sodelujejo. Rezultati raziskave kažejo, da medicinske sestre sicer poznajo spletne strani druge generacije, vendar jih aktivno ne uporabljajo v takšni meri, da bi jim bile v pomoč pri delu. Ključne besede: splet, medicinske sestre, iskanje informacij, mreženje Objavljeno v DKUM: 01.02.2012; Ogledov: 2290; Prenosov: 129
Celotno besedilo (1,05 MB) |
8. |