1. Ugotavljanje uspešnosti inteligentnih sistemov pri ločevanju rakov prostate in debelega črevesaSimon Pucko, 2016, magistrsko delo Opis: Rak na debelem črevesu in rak prostate sta dve izmed najpogostejših rakavih obolenj moške populacije tako v Sloveniji kot tudi po svetu. Pri ženskah se prav tako pojavlja rak na črevesu kot ena izmed najpogostejših oblik raka. Rak je zelo kompleksna vrsta bolezni, za katero točnih vzrokov ne poznamo. Številne raziskave potrjujejo, da je rak posledica tako kombinacije medsebojnega delovanja dednih dejavnikov kot tudi najrazličnejših vplivov okolja.
Cilj magistrske naloge je bil teoretično predstaviti področje raziskovanja ter v nadaljevanju pridobljeno znanje uporabiti na praktičnem primeru. Teoretični del opisuje tako metode podatkovnega rudarjenja, s poudarkom na metodi podpornih vektorjev, kot tudi odločitvena drevesa, s poudarkom na odločitvenem drevesu J48. Predstavili smo tudi proteine, ki regulirajo gensko ekspresijo, tako imenovane transkripcijske faktorje, ki pri nastanku rakavih obolenj igrajo pomembno vlogo. Ker se naš praktičen primer nanaša na obolenje raka na črevesu in raka prostate, smo na kratko predstavili tudi statistične podatke, dejavnike tveganja, simptome ter možnosti zdravljenja obeh omenjenih vrst raka.
V empiričnem delu predstavljamo praktičen primer, ki smo ga izvedli s programskim orodjem Weka in z uporabo podatkovne baze podatkov AP_Colon_Prostate – za to smo se odločili, ker obolenje raka na črevesu in raka prostate spadata med najpogostejša rakava obolenja današnje populacije. V programskem okolju Weka smo ugotavljali, za kako natančna in zanesljiva se izkažeta klasifikator metode podpornih vektorjev (angl. Support vector machine – SVM ali angl. Sequntial minimal optimization – SMO) in klasifikator odločitvenega drevesa J48 pri ugotavljanju genskih ekspresij. S pomočjo programskega okolja Weka smo predstavili tudi najpogostejše gene iz naše podatkovne baze, ki se pojavljajo pri obolenju raka črevesja in raka prostate. Ključne besede: metoda podpornih vektorjev, strojno učenje, klasifikator J48, Weka, rak na črevesu, rak prostate Objavljeno v DKUM: 02.12.2016; Ogledov: 1393; Prenosov: 162 Celotno besedilo (1,32 MB) |
2. ANALIZA IN PRIMERJAVA PLATFORM ZA PODATKOVNO RUDARJENJE RAPIDMINER IN WEKAAleksej Miloševič, 2016, diplomsko delo Opis: V pričujočem diplomskem delu sta analizirani in primerjani splošnonamenski platformi za podatkovno rudarjenje RapidMiner in Weka. V uvodnem delu diplomskega dela so razložene osnove strojnega učenja in podatkovnega rudarjenja ter podrobneje definirane metode dela, ki so uporabljene v praktičnem delu. Primerjava je razdeljena na teoretični in eksperimentalni del. V teoretičnem delu so na podlagi definirane metodologije identificirane pomembne lastnosti orodij in primerjane med seboj, v eksperimentalnem delu pa sta primerjani točnost in F-Mera implementacij algoritmov k-najbližjih sosedov, Naključni gozdovi in Naivni Bayes. S pomočjo statističnih testov je bilo ugotovljeno, da se nobena izvedenka algoritma od drugega statistično pomembno ne razlikuje. Ključne besede: strojno učenje, klasifikacija, primerjava, RapidMiner, Weka Objavljeno v DKUM: 16.09.2016; Ogledov: 2032; Prenosov: 259 Celotno besedilo (2,22 MB) |
3. INTELIGENTNI PREDVAJALNIK GLASBE ZA NAPRAVE ANDROIDDejan Krivec, 2015, diplomsko delo Opis: V diplomskem delu smo podrobneje spoznali Android Studio in Eclipse programsko orodje za razvoj aplikacij. Naredili smo primerjavo med njima in izbrali primernejšo za izdelavo samega izdelka. Izbiro programskega orodja smo tudi utemeljili. Izdelali smo aplikacijo za predvajanje glasbe, ki uporabnikom omogoča samodejno generiranje nabora skladb, ki zadostuje uporabnikovemu počutju. Za klasificiranje skladb smo podrobneje spoznali Weko, ki je namenjena za strojno učenje. Ključne besede: Weka, izenačevalnik zvoka, samodejno generiranje, predvajalnik glasbe Objavljeno v DKUM: 14.10.2015; Ogledov: 1230; Prenosov: 144 Celotno besedilo (1,89 MB) |
4. KLASIFICIRANJE S POMOČJO PODATKOVNE GRAVITACIJEAljaž Heričko, 2014, diplomsko delo Opis: V diplomski nalogi predstavimo osnovne značilnosti klasifikacijskih pristopov, ki temeljijo na podatkovni gravitaciji ter predlagamo nov klasifikacijski algoritem in klasifikator, ki temelji na principu podatkovne gravitacije. Učinkovitost predlaganega klasifikatorja v smislu točnosti razvrščanja smo ovrednotili na naboru sedmih standardnih podatkovnih zbirk in rezultate primerjali z drugimi uveljavljenimi klasifikacijskimi algoritmi. Na osnovi rezultatov eksperimentalne študije lahko sklepamo, da predlagani klasifikator, podobno kot nekateri drugi na podatkovni gravitaciji temelječi pristopi, zagotavljajo zadovoljive in primerljive rezultate nad standardnimi testnimi podatkovnimi množicami. Ključne besede: umetna inteligenca, strojno učenje, podatkovna gravitacija, tehnike klasifikacije, orodje Weka Objavljeno v DKUM: 25.02.2015; Ogledov: 2309; Prenosov: 182 Celotno besedilo (1,66 MB) |
5. RAZVOJ IN IMPLEMENTACIJA KLASIFIKATORJA V OKOLJU WEKALovro Mažgon, 2013, diplomsko delo Opis: Diplomsko delo se nanaša na področje odkrivanja znanja iz podatkov, še natančneje pa opisuje klasifikacijo, priznane klasifikatorje ter mere za določanje kakovosti klasifikacije. V delu smo predstavili razvoj lastnega algoritma za klasifikacijo, ki s pomočjo izračunov oddaljenosti od učnih primerkov določi razred neznanemu primerku. Podali smo matematično definicijo algoritma ter opis implementacije v okolju Weka, s pomočjo katerega smo preizkusili uspešnost klasifikacije na dveh realnih medicinskih primerih. Dobljeni rezultati nakazujejo, da razviti algoritem razmeroma uspešno klasificira primerke in se lahko primerja s priznanimi klasifikatorji. Ključne besede: strojno učenje, podatkovno rudarjenje, klasifikacija, Weka Objavljeno v DKUM: 18.09.2013; Ogledov: 2934; Prenosov: 253 Celotno besedilo (1,32 MB) |
6. SAMODEJNO PRIMERJANJE METOD STROJNEGA UČENJA V OKOLJU WEKAMatic Špindler, 2013, diplomsko delo Opis: V diplomski nalogi je opisano strojno učenje in problemi, ki jih rešujemo s strojnim učenjem. Zajeto in opisano je tudi okolje Weka, s pomočjo katerega lahko iz podatkovnih množic pridobivamo skrito znanje. Predstavljena je tudi struktura ARFF datoteke, kot tudi princip ustvarjanja takšne datoteke ter uporaba le-te. Opisan je razvoj programa za samodejno primerjavo metod strojnega učenja, ki kot rezultat vrne urejen izpis podatkov testiranj podatkovnih množic v Excel datoteko. Princip razvoja programa obsega še opis uporabljene programske opreme in tehnologij, izdelavo uporabniškega vmesnika programa ter nekatere primere kode programskega jezika Java kot rešitev zastavljenega problema. Ključne besede: strojno učenje, okolje Weka, ARFF datoteke, podatkovne množice Objavljeno v DKUM: 18.09.2013; Ogledov: 2186; Prenosov: 184 Celotno besedilo (1,89 MB) |
7. ANALIZA METOD PODATKOVNEGA RUDARJENJA NA PRIMERU IZ KINEZIOLOGIJETadej Plevčak, 2012, diplomsko delo Opis: Naše diplomsko delo predstavlja teoretično osnovo podatkovnega rudarjenja in prikaz na praktičnem primeru. V prvem, teoretičnem delu smo predstavili osnovne koncepte podatkovnega rudarjenja, metode in orodja za učenje in pridobivanje novega znanja ter metode za primerjavo uspešnosti različnih klasifikacijskih modelov. V drugem, praktičnem delu smo najprej analizirali podatkovno množico iz področja kineziologije in poiskali najboljši klasifikacijski model, ki iz podatkov o mišicah (merjenih z metodo TMG) pove kako uspešna je oseba pri nekih športnih preizkusih. Nato smo uporabili najboljše modele (klasifikatorje) za izdelavo aplikacije, s katero je mogoča klasifikacija novih primerkov po opravljenih kinezioloških meritvah. Ključne besede: podatkovno rudarjenje, strojno učenje, klasifikacija, Weka, kineziologija Objavljeno v DKUM: 18.12.2012; Ogledov: 1955; Prenosov: 267 Celotno besedilo (4,71 MB) |
8. PODATKOVNO RUDARJENJE NA PRIMERU ZAVAROVALNICE MARIBORSebastijan Štraus, 2012, diplomsko delo Opis: Diplomsko delo obravnava podatkovno rudarjenje, metode strojnega učenja, obstoječe aplikacije za podatkovno rudarjenje, ter uporabo in integracijo knjižnice Weka v ogrodje .NET, s katerim smo izdelali aplikacijo za obdelavo podatkov Zavarovalnice Maribor. Na Zavarovalnici Maribor smo dobili odobritev, da lahko pri svoji nalogi uporabimo njihove podatke, ki bodo zaradi varnosti nekoliko okrnjeni. V diplomskem delu smo izdelali in opisali aplikacijo, ki omogoča statistično obdelavo vnesenih podatkov in ki na podlagi podatkovnega rudarjenja ter strojnega učenja omogoča analizo in ekstrakcijo določenih pravil, npr. kakšni zavarovanci so najbolj tvegani za zavarovalnico. Ključne besede: podatkovno rudarjenje, strojno učenje, odločitvena drevesa, Bayesov klasifikator, nevronske mreže, hibridne metode, ansambelske metode, grobe množice, asociativna pravila, Apriori, ikvm, Data Miner, Mahout, Weka, .NET Objavljeno v DKUM: 30.11.2012; Ogledov: 3461; Prenosov: 642 (2 glasa) Celotno besedilo (2,19 MB) |
9. ANALIZA LASTNOSTI USPEŠNIH ŠTUDENTOV S PODATKOVNIM RUDARJENJEMMarko Kompara, 2012, diplomsko delo Opis: V nalogi poskušamo odkriti povezave med lastnostmi študentov in njihovim študijskim uspehom. Opisan je celoten proces zbiranja ter analize podatkov in relacij, ki vplivajo na študijski uspeh posameznika. Začnemo s kratkimi navodili o sestavi ankete in nadaljujemo s sestavo svoje. Pridobljene podatke najprej analiziramo z uporabo statistike. Uporabljene metode na kratko opišemo in jih nato izvedemo nad zbranimi podatki. Proces izvajanja, ki je opravljen v programu IBM SPSS Statistics, je tudi predstavljen. Nazadnje uporabimo podatke v podatkovnem rudarjenju. V predstavitvi podatkovnega rudarjenja se posebej posvetimo nalogi klasifikacije in njenim tehnikam. V orodju Weka z odločitvenimi drevesi ugotavljamo povezanost med karakteristikami študentov in njihovim študijskim uspehom. Ključne besede: podatkovno rudarjenje, statistična analiza, SPSS, Weka Objavljeno v DKUM: 27.11.2012; Ogledov: 1860; Prenosov: 441 Celotno besedilo (3,02 MB) |
10. PODATKOVNO RUDARJENJE V LEKARNIŠKI DEJAVNOSTIVlado Pečnik, 2009, diplomsko delo Opis: V diplomski nalogi so najprej opisane osnovne metode in algoritmi podatkovnega rudarjenja, kot so linearna regresija, histogram, analiza gruc, povezovalna pravila
odlocitvena drevesa, nevronske mreže, algoritem K–ti najbližji sosed in algoritem C4.5. Na podrocju oskrbe bolnikov z zdravili so se pokazale potrebe po rudarjenju po
podatkovnih bazah tudi v farmacevtski dejavnosti. Z uporabo algoritma C4.5 za gradnjo odlocitvenih dreves v orodju WEKA smo iz podatkov lekarniške podatkovne baze ugotavljali zakonitosti pri predpisovanju registriranih zdravil. Ključne besede: podatkovno rudarjenje, polifarmakoterapija, polipragmazija, interakcije med zdravili, WEKA. Objavljeno v DKUM: 02.02.2012; Ogledov: 3463; Prenosov: 531 Celotno besedilo (2,81 MB) |