1. Primerjava SVM, MLR in PCA metod pri napovedovanju fotovoltaične proizvodnje v slovenijiAnja Goričan, 2019, magistrsko delo Opis: Zaradi teženj po trajnostni in obnovljivi energiji se v elektroenergetski sistem priključuje vedno večji delež fotovoltaičnih virov elektrike. Stabilnost elektroenergetskega sistema je ena ključnih nalog, ki jo mora zagotavljati operater prenosnega omrežja. Ob vedno večjem deležu fotovoltaike v sistemu je to vedno težje zagotavljati, saj se vrednosti proizvodnje fotovoltaičnih virov elektrike spreminjajo nepredvidljivo. Deležniki elektroenergetskega sistema pa morajo vnaprej zagotoviti usklajenost porabe in proizvodnje električne energije. V ta namen pregledamo vpliv različnih metod na napovedovanje proizvodnje fotovoltaike na območju Slovenije. Ob vplivu napovedovalnih metod preverjamo tudi vpliv napovedanega in realnega vremena na proces modeliranja in napovedovanja. V prvem delu magistrskega dela pregledamo osnovne matematične pojme, ki jih potrebujemo za nadaljnjo teorijo o napovedovalnih metodah. Nato predstavimo matematične koncepte metod napovedovanja. V drugem delu se osredotočimo na prikaz rezultatov napovedovanja po napovedovalnih metodah in različnih vhodnih podatkih. Po pregledu rezultatov ugotovimo, da se na predstavljenem kontekstu napovedovanja najbolje obnese metoda podpornih vektorjev z radialnim jedrom. Upoštevati moramo tudi predprocesiranje podatkov, saj je pred napovedovanjem potrebno podatke preslikati z metodo glavnih komponent. Pomemben delež k izboljšanju napake pri napovedovanju prinese tudi uporaba dejanskih podatkov o vremenu, ki se uporabijo v procesu modeliranja. Ključne besede: fotovoltaika, napovedovanje fotovoltaične proizvodnje, metoda podpornih vektorjev, metoda glavnih komponent, multipla linearna regresija Objavljeno v DKUM: 20.11.2019; Ogledov: 1766; Prenosov: 164
Celotno besedilo (1,05 MB) |
2. Metoda podpornih vektorjev v detekciji goljufijManja Krajnčič, 2019, magistrsko delo Opis: Magistrsko delo obravnava problem odkrivanja goljufij za izbrani scenarij. Scenarij nam predstavlja eno obliko goljufanja, ki jo želimo razkriti z uporabo ustrezne metode. Kljub temu, da je za odkrivanje goljufij razvitih veliko metod, pa vse niso ustrezne. Metode, ki se v prvi vrsti delijo na nadzorovane in nenadzorovane, ne odkrijejo vseh vrst goljufij, zato je zelo pomembno, da ustvarimo več scenarijev in prilagodimo metode glede na naš nabor podatkov, s tem pa pokrijemo večjo množico možnih goljufov.
Za scenarij si izberemo goljufanje gostincev, nad katerim razvijemo novo metodo za odkrivanje transakcijskih goljufij. Rezultate primerjamo tudi z rezultati, ki jih nad isto množico podatkov dobimo pri uporabi metode podpornih vektorjev enega razreda. Glavni rezultat magistrske naloge nam predstavlja kombinacijo uporabe dveh metod za rangiranje gostincev od najbolj do najmanj sumljivih. Ključne besede: odkrivanje goljufij, subvencionirana študentske prehrana, metoda FSRO, metoda podpornih vektorjev enega razreda Objavljeno v DKUM: 29.08.2019; Ogledov: 1609; Prenosov: 109
Celotno besedilo (1,31 MB) |
3. Razvoj napovednega modela za trgovanje z delniškimi vrednostnimi papirji na slovenskem borznem trguPrimož Cimperman, 2018, magistrsko delo/naloga Opis: Vpetost informacijsko-komunikacijske tehnologije v vsakdanje življenje je povzročila množično zbiranje, shranjevanje in obdelovanje podatkov, iz katerih se pridobivajo različne informacije, ki jih človek spretno uporablja pri vsakdanjih odločitvah tako doma kot na preostalih področjih svojega delovanja. Ob njihovi uporabi mora pri tem oceniti njihovo korist oziroma morebitno tveganje, ki jih pridobljena informacija prinaša. Podobno to velja tudi za trgovanje z vrednostnimi papirji na borzi, saj je primerno za lažjo odločitev o nakupu oziroma prodaji uporabiti določene pripomočke, ki so zasnovani v obliki programskih orodij. Ta nam na podlagi izbranega seta podatkov določene delnice izvajajo simulacije o potencialnem gibanju tečajnih vrednosti v prihodnosti.
V magistrskem delu smo izdelali več napovednih modelov, pri katerih smo uporabili različne metode napovedovanja, ki se pogosto uporabljajo pri analizah gibanja tečajnih vrednosti delnic. Z metodologijo CRISP-DM smo razvili štiri napovedne modele, ki se med seboj razlikujejo tako po uporabljeni metodi kot tudi po primernosti časovnega obdobja napovedovanja. Z ocenami posameznih modelov na izbranih delnicah smo prišli do različnih ugotovitev, ki so nam podale širšo sliko o tem, kakšne so prednosti in slabosti posameznih modelov ter kateri model se je izkazal za najučinkovitejšega pri napovedovanju gibanja tečajev delnic.
S pridobljenimi spoznanji si lahko pomagamo pri odločanju, ki zadeva borzno trgovanje na primeru izbranih delnic. Ključne besede: odkrivanje znanja v podatkih, strojno učenje, podatkovno rudarjenje, metoda podpornih vektorjev, logistična regresija, trg vrednostnih papirjev. Objavljeno v DKUM: 05.06.2018; Ogledov: 1447; Prenosov: 127
Celotno besedilo (2,55 MB) |
4. Ugotavljanje uspešnosti inteligentnih sistemov pri ločevanju rakov prostate in debelega črevesaSimon Pucko, 2016, magistrsko delo Opis: Rak na debelem črevesu in rak prostate sta dve izmed najpogostejših rakavih obolenj moške populacije tako v Sloveniji kot tudi po svetu. Pri ženskah se prav tako pojavlja rak na črevesu kot ena izmed najpogostejših oblik raka. Rak je zelo kompleksna vrsta bolezni, za katero točnih vzrokov ne poznamo. Številne raziskave potrjujejo, da je rak posledica tako kombinacije medsebojnega delovanja dednih dejavnikov kot tudi najrazličnejših vplivov okolja.
Cilj magistrske naloge je bil teoretično predstaviti področje raziskovanja ter v nadaljevanju pridobljeno znanje uporabiti na praktičnem primeru. Teoretični del opisuje tako metode podatkovnega rudarjenja, s poudarkom na metodi podpornih vektorjev, kot tudi odločitvena drevesa, s poudarkom na odločitvenem drevesu J48. Predstavili smo tudi proteine, ki regulirajo gensko ekspresijo, tako imenovane transkripcijske faktorje, ki pri nastanku rakavih obolenj igrajo pomembno vlogo. Ker se naš praktičen primer nanaša na obolenje raka na črevesu in raka prostate, smo na kratko predstavili tudi statistične podatke, dejavnike tveganja, simptome ter možnosti zdravljenja obeh omenjenih vrst raka.
V empiričnem delu predstavljamo praktičen primer, ki smo ga izvedli s programskim orodjem Weka in z uporabo podatkovne baze podatkov AP_Colon_Prostate – za to smo se odločili, ker obolenje raka na črevesu in raka prostate spadata med najpogostejša rakava obolenja današnje populacije. V programskem okolju Weka smo ugotavljali, za kako natančna in zanesljiva se izkažeta klasifikator metode podpornih vektorjev (angl. Support vector machine – SVM ali angl. Sequntial minimal optimization – SMO) in klasifikator odločitvenega drevesa J48 pri ugotavljanju genskih ekspresij. S pomočjo programskega okolja Weka smo predstavili tudi najpogostejše gene iz naše podatkovne baze, ki se pojavljajo pri obolenju raka črevesja in raka prostate. Ključne besede: metoda podpornih vektorjev, strojno učenje, klasifikator J48, Weka, rak na črevesu, rak prostate Objavljeno v DKUM: 02.12.2016; Ogledov: 1393; Prenosov: 163
Celotno besedilo (1,32 MB) |
5. UGOTAVLJANJE GENSKIH PREDIKTORJEV S POMOČJO INTELIGENTNIH SISTEMOVNejc Rednjak, 2015, magistrsko delo Opis: Pri strojnem učenju (angl. Machine Learning) gre za pridobivanje znanja na podlagi izkušenj. Ne gre za učenje na pamet, ampak za iskanje pravil v učnih podatkih. Najbolj znane metode strojnega učenja so odločitvena drevesa (DT), metoda podpornih vektorjev (SVM) in nevronske mreže (NN). Metode strojnega učenja so nam v pomoč pri ugotavljanju genskih prediktorjev. Algoritmi strojnega učenja imajo prav tako pomembno vlogo pri diagnosticiranju rakavih obolenj. V magistrskem delu smo opisali najbolj znane metode strojnega učenja in jih preizkusili na podatkovni bazi AP_Colon_Kidney. Uporabili smo podatkovno bazo iz spletne zbirke GEMLeR, ki vsebuje podatke o genski ekspresiji za več kot 2000 vzorcev tumorjev. Raziskali smo tudi, kateri geni so najbolj izraženi v primeru rakavega obolenja debelega črevesa in ledvic. Ključne besede: strojno učenje, odločitvena drevesa, nevronske mreže, metoda podpornih vektorjev, gen, podatkovna baza. Objavljeno v DKUM: 24.09.2015; Ogledov: 3143; Prenosov: 194
Celotno besedilo (1,75 MB) |
6. IDENTIFIKACIJA OSEB NA OSNOVI GIBANJA TELESA, ZAJETEGA Z NAPRAVO KINECTPeter Zlodej, 2013, diplomsko delo Opis: V diplomskem delu je predstavljen postopek identifikacije oseb na podlagi posnetkov
človeške hoje, zajetih z napravo Kinect. Opisan je proces zajemanja signalov,
predobdelave podatkov in strojnega učenja z metodo podpornih vektorjev. Predstavljeni
so tudi rezultati testiranj uspešnosti postopka. Ugotovili smo, da je na podlagi signalov
hoje, zajetih z napravo Kinect, možno razpoznati osebo iz množice petih oseb z
natančnostjo 93,13 ± 9,99 %. Ključne besede: identifikacija oseb, senzor Kinect, analiza hoje, metoda podpornih
vektorjev, biometrija. Objavljeno v DKUM: 20.09.2013; Ogledov: 2074; Prenosov: 177
Celotno besedilo (1,92 MB) |
7. SAMODEJNA KLASIFIKACIJA GLASBENIH ŽANROV ZVOČNIH POSNETKOVDal Rupnik, 2013, magistrsko delo Opis: V magistrskem delu predstavimo sistem, ki na mobilni platformi iOS samodejno klasificira glasbeni žanr zvočnih posnetkov na podlagi zajetih vrednosti značilnic. Sistem za posamezen posnetek izračuna vektor značilnic, ki opredeljujejo ritmične, tonske in energetske lastnosti posnetka. Na osnovi učne množice vektorjev z označenim glasbenim žanrom se sistem nauči značilnosti posameznih žanrov, na podlagi le teh pa kasneje opravlja klasifikacijo testnih posnetkov, ki nimajo označenega glasbenega žanra. Klasifikacijo smo izvedli z metodo podpornih vektorjev in pri tem na 1.000 testnih posnetkih dosegli 64 % natančnost ločevanja med naslednjimi desetimi žanri: blues, klasična glasba, country, disco, hip hop, jazz, metal, pop, reggae in rock. Ključne besede: klasifikacija glasbenih žanrov, analiza posnetka, značilnice glasbe, strojno učenje, metoda podpornih vektorjev, mobilna platforma Objavljeno v DKUM: 13.09.2013; Ogledov: 2482; Prenosov: 226
Celotno besedilo (3,50 MB) |
8. NAPREDNI MODELI NEPLAČILA NA PRIMERU PREBIVALSTVAAnja Colja, 2009, diplomsko delo Opis: Zavedamo se, da je za banko dodeljevanje kreditov fizičnim in pravnim osebam zelo
pomemben in odgovoren proces. Zato želimo v diplomskem delu približati pomen in
uporabo naprednih modelov neplačil na primeru prebivalstva.
Diplomsko delo ločita dve področji. V prvem so predstavljena teoretična spoznan-
ja strojnega učenja, klasifikacije, kreditnega točkovanja, metod strojnega učenja ter
njihove ocene in mere. Drugo, analitično področje seznanja z raziskovalnim pro-
gramom Orange in predstavitvijo ter obdelavo uporabljenih podatkov odobrenih in
zavrnjenih kreditojemalcev.
Izhodišče za analizo so podatki pridobljeni, iz nemškega inštituta za statistiko in
ekonometrijo, zbrani leta 1994. Teoretična in empirična spoznanja metod strojne-
ga učenja so pripomogla k nadaljnjim raziskavam in ugotovitvam. Poskušali smo
napovedati kateri kreditojemalci bodo kredit vrnili.
Iz pridobljenih rezultatov sklepamo, da bi za kakovosten in točen izid potrebo-
vali sistematičen pristop (večjo količino aktualnih podatkov kreditojemalcev), saj
z razpoložljivimi podatki klasifikacija novih kreditojemalcev ne bi bila uspešna. S
pomočjo rezultatov metod in meril za strojno učenje smo izbrali najinformativnejše
atribute. Dokazali smo, da dosežemo skoraj isto klasifikacijsko točnost z izbranimi
osmimi atributi kot z vsemi dvajsetimi. Z združitvijo lastnih in izbranih karakteristik
nam je uspelo zagotoviti smernice, ki bi slovenskim bankam omogočale izboljšanje
sistema za odobritev kreditov. Zaključimo, da bi bilo koristno če bi banke uporabl-
jale poenotena merila za dodeljevanje posojil. Zagotovile bi enakopraven, pregleden
in učinkovit pristop k reševanju kreditne problematike. Ključne besede: krediti, strojno učenje, klasifikacija, odločitveno drevo, metoda podpornih vektorjev, kreditno točkovanje. Objavljeno v DKUM: 11.02.2010; Ogledov: 2695; Prenosov: 319
Celotno besedilo (2,60 MB) |