| | SLO | ENG | Cookies and privacy

Bigger font | Smaller font

Search the digital library catalog Help

Query: search in
search in
search in
search in
* old and bologna study programme

Options:
  Reset


1 - 10 / 44
First pagePrevious page12345Next pageLast page
1.
Implementacija sistema za klasifikacijo novic o vrednostnih papirjih
Jure Jakič, 2021, master's thesis

Abstract: Klasifikacija novic o podjetjih predstavlja časovno zelo dolgotrajen proces, saj je vsako novico potrebno prebrati in ji na podlagi vsebine določiti vsebinski pomen. Z razvojem metod za podatkovno rudarjenje lahko ta proces avtomatiziramo, s čimer novice razvrščamo v zanemarljivem času. V okviru magistrskega dela smo razvili sistem pridobivanja, prečiščevanja in klasifikacije novic. Novice smo pridobivali iz brezplačnih spletnih virov ter si ustvarili korpus besedil, ki smo jih najprej obdelali z orodjem Orange ter nato zgradili napovedne modele z uporabo različnih algoritmov. S pomočjo vizualizacij in matrike zamenjav smo prikazali kakovost napovednih modelov ter jih na podlagi njihove uspešnosti ovrednotili. S pomočjo ML.NET knjižnice smo na koncu razvili sistem avtomatske klasifikacije, ki novice glede na njihovo vsebino z 80 % natančnostjo klasificira v skupine.
Keywords: podatkovno rudarjenje, klasifikacija tekstov, trgovanje, novice, vrednostni papir
Published: 09.08.2021; Views: 77; Downloads: 13
.pdf Full text (1,84 MB)

2.
Razvoj metodologije za avtomatično klasifikacijo elektronskih publikacij v univerzalno decimalno klasifikacijo – udk24112018
Matjaž Kragelj, 2019, doctoral dissertation

Abstract: Čeprav so znanstveni in strokovni članki večinoma bibliografsko obdelani in imajo zapis v knjižničnem katalogu COBIB, ter s tem definiranega enega ali več vrstilcev iz sistema Univerzalne decimalne klasifikacije (UDK), je večina člankov, dostopnih prek portala Digitalne knjižnice Slovenije, predvsem s področja kulture (starejši članki iz revij in časopisov), ki takšnega zapisa nimajo. Na spletnem mestu Digitalne knjižnice Slovenije je mogoče preiskovanje dokumentov zgolj po polnem besedilu. To je trenutno najboljše orodje za preiskovanje starejših besedil, a uporaba in preiskovanja publikacij na tak način, zaradi pomanjkljivosti (slabša kvaliteta razpoznave besedila v časopisih in revijah starejšega tipa, uporaba stare slovenščine, itd.) in prevelikega števila vrnjenih zadetkov pri iskanju, ne nudi sodobne uporabniške izkušnje in uporabniku otežuje delo. Osnovni problem, ki ga naslavljamo v disertaciji je pomoč pri bibliografski obdelavi besedil, ki je še vedno v rokah človeških ekspertov. Izhajamo iz teze, da je s pomočjo metod strojnega učenja možno avtomatsko klasificirati besedila v ustrezen UDK vrstilec in s tem podpreti človeka pri bibliografski obdelavi zapisov. V ta namen smo po pristopu načrtovanja in razvoja razvili klasifikacijski model, ki smo ga uporabili za klasificiranje starih besedil, ki so bila doslej klasificirana večinoma zgolj posredno, preko klasifikacije celotne revije oz. časopisa, kot na primer "Časopisi. Tisk. Novinarstvo". V disertaciji smo razvili klasifikacijski model s pomočjo metod strojnega učenja, s katerimi smo uspeli avtomatsko klasificirati kakršnokoli besedilo s pomočjo Univerzalne decimalne klasifikacije. Med tehnikami strojnega učenja smo se poslužili nenadzorovanega in nadzorovanega učenja. V prvem koraku smo nad manjšo množico podatkov (900 člankov) nenadzorovano učenje uporabili za preverjanje sorodnosti med dodeljenimi UDK vrstilci s strani bibliotekarjev in izgrajenimi gručami s strani algoritma. V drugem koraku smo nad celotnim korpusom znanstvenega časopisja Digitalne knjižnice Slovenije (več kot 70.000 znanstvenih besedil) razvili klasifikacijske modele, kjer je bilo razmerje učne in testne množice je bilo 80/20 odstotkov. Ko smo potrdili uspešnost klasifikacijskih modelov nad znanstvenimi besedili, smo jih uporabili za klasifikacijo več kot 200.000 starejših besedil. Uporabili smo Naivni Bayesov klasifikator, Metodo podpornih vektorjev, Večslojni perceptron, Logistično regresijo in algoritem k najbližjih sosedov. Ustreznost klasifikacije starih besedil smo preverili s človeškimi eksperti – bibliotekarji. Potrdili smo domnevo, da lahko s pomočjo znanstvenih in strokovnih člankov, klasificiranih v UDK, v vsaj 80% primerov ponudimo avtomatsko določene UDK vrstilce za starejše gradivo, ki ni bibliotekarsko obdelano. Poudariti velja, da gre pri tem delu za človeško odločitev, testiranje s človeškimi eksperti, za oceno in presojo, ki lahko variira od odločevalca do odločevalca. Poleg oplemenitenja starejših besedil iz osemnajstega, devetnajstega in prve polovice dvajsetega stoletja s vsebinskimi oznakami UDK vrstilcev, ima raziskava praktično moč v vsakodnevni rabi. Z gledišča podpore avtomatske klasifikacije publikacij pri vsakodnevnem delu bibliotekarjev, vidimo moč implementacije raziskave v informacijski sistem, ki je bibliotekarju sposoben v realnem času ponuditi izračunane predloge za določitev primernih klasifikatorjev publikacije, ki jo obdeluje. Bibliotekar lahko pridobi s strani stroja "drugo mnenje" pri procesu dodeljevanja UDK vrstilcev publikaciji, ki jo obdeluje. Hkrati je metodologija lahko uporabljena na različnih področjih in podatkovnih bazah ter klasifikacijskih sistemih, ne zgolj za dodeljevanje UDK vrstilcev.
Keywords: Umetna inteligenca, strojno učenje, podatkovno rudarjenje, Univerzalna decimalna klasifikacija, klasifikacija besedil
Published: 03.02.2021; Views: 243; Downloads: 34
.pdf Full text (4,35 MB)

3.
Uporaba metod strojnega učenja za izboljšanje spletnega vprašalnika
Duško Rodić, 2020, master's thesis

Abstract: Zbiranje podatkov preko spletnega vprašalnika je v današnjem času pravzaprav stalnica, saj gre za hiter in učinkovit način za zajemanje podatkov iz širše populacije. Pogosto pa so vprašalniki predolgi in tudi kompleksne, zato ne zajemamo ciljne populacije in ne dobimo prave slike o raziskovanem stanju. Poseben primer je zajemanje podatkov z namenom ocene primernosti uporabe zalo-zmogljivega računalništva v oblaku za mala in srednje velika podjetja. Ta vprašalnik je namenjen zajemu vhodnih podatkov za večkriterijski model, ki omogoča oceno potenciala, ki v praksi ni v celoti zaživel. Izhajamo iz predpostavke, da je tudi kompleksnost vprašalnika vplivala na šibek odziv respondentov. Iz tega smo razvili raziskovalno vprašanje: »Ali je mogoče vprašalnik skrajšati s pomočjo strojnega učenja?«. Cilj magistrske naloge je, da s pomočjo metod strojnega učenja skušamo ugotoviti katera vprašanja največ prispevajo k oceni potenciala ter na ta način skrajšati vprašalnik. Problem smo reševali z uporabo metod strojnega učenja. V ta name smo analizirali večkriterijski model, vprašalnik za zajemanje podatkov, odgovore respondentov ter v programu Orange , ki poleg metod strojnega učenja vsebuje tudi vizualizacijo podatkov, IV analizirali prispevek posameznega vprašanja h končni oceni. Rezultati kažejo, da imajo nekateri kriteriji večji vpliv na končno oceno potenciala uporabe zelo-zmogljivega računalništva v oblaku, vendar se ti kriteriji nanašajo na splošne atribute primerov (npr. država, vrsta organizacije). Ob izločitvi trivialnih kriterijev napoved modela še vedno ni dovolj natančna, zato je edini zaključek, ki ga lahko potegnemo, da na pričujočih podatkih ni bilo možno izbrati takega nabora kriterijev oziroma vprašanj, s katerimi bi lahko natančno ocenili potencial uporabe zelo-zmogljivega računalništva v oblaku.
Keywords: - zelo-zmogljivo računalništvo, - oblak, - strojno učenje, - podatkovno rudarjenje, - Orange (program).
Published: 23.12.2020; Views: 211; Downloads: 22
.pdf Full text (4,63 MB)

4.
Interaktivna vizualizacijska orodja za izboljševanje športnih treningov
Roman Šuster, 2020, master's thesis

Abstract: Vsakodnevno se soočamo z veliko količino podatkov, ki jih generirajo elektronske naprave. Še več, ta količina se z dneva v dan celo povečuje in temu povečevanju ni videti konca. Vseprisotne elektronske naprave so korenito spremenile tudi življenje človeka. Med drugim te naprave beležijo naše odločitve, na podlagi katerih določajo naše preference, spremljajo naše nakupovalne navade v trgovinah, odkrivajo naše finančne navade in obnašanje na družbenih omrežjih. Zaradi vsega prej omenjenega so se razvile metode, ki omogočajo shranjevanje in obdelavo velike količine podatkov, ki jih danes označujemo z izrazom masivni podatki (angl. big data). V pričujočem magistrskem delu smo se lotili obdelave podatkov športnikov (natančneje kolesarjev) dobljenih iz športnih ur (npr. Polar, Garmin ipd.), ki spremljajo športnika med treningi. Na podlagi te analize lahko športni trener določi trende v obnašanju športnika znotraj predpisanih časovnih intervalov, na podlagi česar lahko ta ugotavlja, v kakšni trenutni formi je njegov varovanec in napovedati priporočila za njegov nadaljnji trening.
Keywords: podatkovno rudarjenje, analiza podatkov, vizualizacija, šport, spletna aplikacija
Published: 04.11.2020; Views: 180; Downloads: 21
.pdf Full text (5,91 MB)

5.
Podatkovno rudarjenje pri iskanju najkoristnejšega posameznika košarkarske lige nba
Jaša Kšela, 2020, undergraduate thesis

Abstract: Diplomsko delo prikazuje uporabo različnih metod podatkovnega rudarjenja, kot pomoč pri iskanju najkoristnejšega igralca ameriške profesionalne košarkarske lige NBA. Podatkovna baza je bila ustvarjena s pomočjo spletnega luščenja. Izluščene podatke smo nato vizualno predstavili in s pomočjo izvedenih metod strojnega učenja nad njimi poizkušali napovedati prihodnjega najkoristnejšega posameznika. Metode smo na koncu med seboj primerjali.
Keywords: podatkovno rudarjenje, košarka, strojno učenje, NBA, šport
Published: 03.11.2020; Views: 242; Downloads: 39
.pdf Full text (993,75 KB)

6.
Rekurzivna delitev modelov linearne regresije za oceno zanimivosti asociativnih pravil v različnih časovnih obdobjih
Goran Hrovat, 2018, doctoral dissertation

Abstract: Zanimivosti asociativnih pravil ali pogostih množic postavk se lahko skozi čas spreminjajo. Prav tako je lahko njihova zanimivost različna za različne skupine (npr. skupine ljudi). V doktorski disertaciji je predstavljen nov algoritem za določanje zanimivosti asociativnih pravil in množic postavk v različnih časov¬nih obdobjih. Algoritem odkriva skupine pacientov, ki se glede na trend zanimivosti asociativnega pravila statistično značilno razlikujejo. Rezultat algoritma je odločitveno regresijsko drevo, katerega povezave predstavljajo različne skupine pacientov, listi pa prikazujejo grafe z zanimivostmi asociativnega pravila ali množice postavk v različnih časovnih obdobjih. Pokazali smo tudi, da podpora pogoste množice postavk vpliva na kompleksnost zgrajenega regresijskega drevesa. Za demonstracijo smo uporabili elektronske zdravstvene zapise, zbrane v obdobju 15 let, ki predstavljajo odpuste pacientov iz različnih bolnišnic v Združenih državah Amerike. Predstavljeni algoritem predstavlja v tem primeru uporabno vrednost za bolnišnice, zavarovalnice, raziskovalne in ostale institucije, saj jih lahko odkrito znanje vodi do novih spoznanj in optimizacije poslovanja.
Keywords: podatkovno rudarjenje, mere zanimivosti, asociativna pravila, podpora odločanju, regresijsko dre-vo, linearna regresija, elektronski zdravstveni zapis
Published: 12.07.2018; Views: 1052; Downloads: 74
.pdf Full text (17,46 MB)

7.
Razvoj napovednega modela za trgovanje z delniškimi vrednostnimi papirji na slovenskem borznem trgu
Primož Cimperman, 2018, master's thesis/paper

Abstract: Vpetost informacijsko-komunikacijske tehnologije v vsakdanje življenje je povzročila množično zbiranje, shranjevanje in obdelovanje podatkov, iz katerih se pridobivajo različne informacije, ki jih človek spretno uporablja pri vsakdanjih odločitvah tako doma kot na preostalih področjih svojega delovanja. Ob njihovi uporabi mora pri tem oceniti njihovo korist oziroma morebitno tveganje, ki jih pridobljena informacija prinaša. Podobno to velja tudi za trgovanje z vrednostnimi papirji na borzi, saj je primerno za lažjo odločitev o nakupu oziroma prodaji uporabiti določene pripomočke, ki so zasnovani v obliki programskih orodij. Ta nam na podlagi izbranega seta podatkov določene delnice izvajajo simulacije o potencialnem gibanju tečajnih vrednosti v prihodnosti. V magistrskem delu smo izdelali več napovednih modelov, pri katerih smo uporabili različne metode napovedovanja, ki se pogosto uporabljajo pri analizah gibanja tečajnih vrednosti delnic. Z metodologijo CRISP-DM smo razvili štiri napovedne modele, ki se med seboj razlikujejo tako po uporabljeni metodi kot tudi po primernosti časovnega obdobja napovedovanja. Z ocenami posameznih modelov na izbranih delnicah smo prišli do različnih ugotovitev, ki so nam podale širšo sliko o tem, kakšne so prednosti in slabosti posameznih modelov ter kateri model se je izkazal za najučinkovitejšega pri napovedovanju gibanja tečajev delnic. S pridobljenimi spoznanji si lahko pomagamo pri odločanju, ki zadeva borzno trgovanje na primeru izbranih delnic.
Keywords: odkrivanje znanja v podatkih, strojno učenje, podatkovno rudarjenje, metoda podpornih vektorjev, logistična regresija, trg vrednostnih papirjev.
Published: 05.06.2018; Views: 690; Downloads: 75
.pdf Full text (2,55 MB)

8.
Napovedovanje rezultatov rehabilitacije
Jakob Jančar, 2017, bachelor thesis/paper

Abstract: Pridobili smo datoteko z izbranimi podatki o pacientih in pacientkah, ki so doživeli srčni infarkt. Zanimalo nas je, kateri parametri nam lahko pomagajo napovedati uspešnost rehabilitacije po srčnem infarktu. Proces podatkovnega rudarjenja je bil izveden z uporabo programa Orange. Uporabljene metode podatkovnega rudarjenja so bile Bayesov algoritem, CN2 inducirana pravila in odločitvena drevesa. Z uporabo teh metod je bil zgrajen model, ki omogoča testiranje vsake izmed metod, kar služi primerjavi metod. Za posamezno metodo so bile izbrane ustrezne funkcije vizualizacije, ki predstavijo odločitveno znanje. Naloga obravnava dva izmed možnih kriterijev za uspešno rehabilitacijo. Za vsakega izmed obeh primerov je podana primerjava rezultatov uporabljenih metod.
Keywords: • Podatkovno rudarjenje • Srčni infarkt • Proces rehabilitacije
Published: 21.12.2017; Views: 696; Downloads: 67
.pdf Full text (2,58 MB)

9.
Uporaba napredne analitike pri upravljanju z veliko količino podatkov na primeru cortana intelligence suite
Špela Berglez, 2017, undergraduate thesis

Abstract: V diplomskem projektu Uporaba napredne analitike pri upravljanju z veliko količino podatkov na primeru Cortana Intelligence Suite, smo se osredotočili na dve temeljni tematiki – masovne podatke in napredno analitiko. Z masovnimi podatki poimenujemo velike količine, visoke hitrosti in raznolike vrste informacijskih sredstev ter podatkov, ki zahtevajo stroškovno učinkovito in inovativno obdelavo, ki omogoča nadgrajeno pridobivanje spoznanj, sprejemanje odločitev ter avtomatizacijo procesov. Ti so tesno povezani z napredno analitiko, pri kateri gre za analiziranje podatkov in vsebin z uporabo naprednih tehnik in orodij, ki presegajo tradicionalne analitične postopke. S pomočjo napredne analitike lahko odkrivamo globlja spoznanja, oblikujemo napovedi in ustvarjamo priporočila. Obe tematiki smo podrobno predstavili in pojasnili temeljne teoretične zakonitosti in najnovejše trende na teh področjih. V zadnjem delu diplomskega projekta smo teoretično znanje iz področja masovnih podatkov in napredne analitike združili in njuno povezavo pojasnili na praktičnem primeru rešitve Cortana Intelligence Suite. Cortana Intelligence Suite je zbirka integriranih orodij in storitev, namenjenih vključevanju in avtomatizaciji napredne analitike v podjetja. Posamezna orodja, platforme in storitve smo natančno razložili in pojasnili koncepte delovanja. Za konec smo predstavili še študiji primera, ter z njima podkrepili vse predstavljene teoretične zakonitosti.
Keywords: masovni podatki, napredna analitika, cortana intelligence suite, podatkovno rudarjenje, strojno učenje
Published: 28.11.2017; Views: 874; Downloads: 147
.pdf Full text (1,94 MB)

10.
Uporaba orodja Orange za podatkovno rudarjenje
Damir Kos, 2017, undergraduate thesis

Abstract: Ob vse večjem številu informacij, ki krožijo na najrazličnejše načine, je podatkovno rudarjenje za uspešno in učinkovito rabo informacij ključnega pomena. Preko podatkovnega rudarjenja namreč dosežemo rezultate, s katerimi ugotovimo ustreznost informacij, odpravimo pomanjkljivosti, poiščemo vzorce, znanje in podobno. V diplomskem delu je predstavljen program Orange, delo z njim, njegova uporaba ter nekatere lastnosti. Glavni segmenti podatkovnega rudarjenja s programom Orange, ki so predstavljeni v diplomskem delu, so klasifikacija, gručenje in pred procesiranje podatkov. Praktični del diplomskega dela, ki je hkrati ključen, je razdeljen na tri dele. Prvi del predstavlja vse tri glavne segmente preko uporabniškega vmesnika, drugi del preko kode, v tretjem delu pa se nato prikaže izgradnja lastnega modula in njegova uporaba.
Keywords: podatkovno rudarjenje, orodje Orange, klasifikacija, gručenje, predprocesiranje podatkov
Published: 24.10.2017; Views: 1126; Downloads: 228
.pdf Full text (2,35 MB)

Search done in 0.16 sec.
Back to top
Logos of partners University of Maribor University of Ljubljana University of Primorska University of Nova Gorica