SLO | ENG

Večja pisava | Manjša pisava

Iskanje po katalogu digitalne knjižnice Pomoč

Iskalni niz: išči po
išči po
išči po
išči po
* po starem in bolonjskem študiju

Opcije:
  Ponastavi


1 - 2 / 2
Na začetekNa prejšnjo stran1Na naslednjo stranNa konec
1.
Metoda alokacije za klasifikacijo neuravnoteženih podatkov
Sašo Karakatič, 2017, doktorska disertacija

Opis: V doktorski disertaciji predstavimo metodo z imenom alokacija, ki je namenjena klasifikaciji neuravnoteženih podatkov. Metoda alokacije je klasifikacijski ansambel iz dveh nivojev. V prvem nivoju deluje alokator, ki se s pomočjo algoritmov nenadzorovanega učenja nauči učinkovito deliti izvorno množico podatkov na homogene podmnožice, ki se nato alocirajo specializiranim klasifikatorjem na drugem nivoju. Drugi nivo sestavlja množica specializiranih klasifikatorjev, kjer je vsak naučen na specifični podmnožici, ki mu je bila alocirana, in se tako specializira za točno določeno vrsto podatkov. Ti klasifikatorji tako vrnejo končno odločitev o razredu posameznih instanc, kar je tudi rezultat metode alokacije. Z namenom preizkusa delovanja koncepta metode alokacije smo v okviru doktorske disertacije razvili dve varianti alokatorja -- alokator z detekcijo anomalij, ki uporablja eno razredni klasifikator SVM, in alokator z gručenjem k-means. Obe vrsti alokatorja smo preizkusili v kombinaciji s šestimi klasifikacijskimi metodami na mestu specializiranih klasifikatorjev na drugem nivoju. Vse variante metode alokacije v vseh kombinacijah smo preverili na neuravnoteženih in uravnoteženih podatkih, slednje z namenom validacije metode kot splošnega klasifikacijskega pristopa. Rezultate alokacij smo primerjali z obstoječimi metodami za spopadanje z neuravnoteženi podatki -- informiranim podvzorčenjem, nadvzorčenjem SMOTE in ansambli bagging, MultiBoost in AdaBoost. V eksperimentih smo primerjali rezultate metrik klasifikacije (ki smo jih identificirali v teoretičnem delu disertacije) in čase, potrebne za učenje klasifikacijskega modela. Rezultate eksperimentov smo dodatno preverili s statistično analizo in na podlagi tega prišli do zaključkov, da je metoda alokacije učinkovita alternativa obstoječim pristopom pri klasifikaciji neuravnoteženih in tudi uravnoteženih podatkov.
Ključne besede: strojno učenje, klasifikacija, neuravnoteženi podatki, detekcija anomalij, alokacija, gručenje, ansambli
Objavljeno: 10.05.2017; Ogledov: 475; Prenosov: 91
.pdf Celotno besedilo (3,59 MB)

2.
Razvoj spletne aplikacije in napovednega modela za napoved nediagnosticirane sladkorne bolezni tipa 2
Andrej Fajfar, 2017, magistrsko delo

Opis: V magistrski nalogi smo s pomočjo metode strojnega učenja »Random Forest« skušali napovedati stopnjo tveganja za nastanek sladkorne bolezni oz. verjetnost prisotnosti nediagnosticirane sladkorne bolezni na podlagi podatkov iz Slovenije. Za izbrano metodo smo določili optimalno število in vrsto spremenljivk za posamezni model. Za evalvacijo modela smo uporabili povprečno območje pod krivuljo (AUC), točnost in F-mero. Za model populacije s povečanim tveganjem smo dosegli povprečno AUC 0,823, točnost 0,824 in F-mero 0,804. V modelu za napoved nediagnostirane sladkorne bolezni smo dosegli povprečno AUC in točnost 0,749 in F-mero 0,654. Na podlagi podatkov smo pokazali, da je možno z veliko uspešnostjo določiti osebe z visokim tveganjem, ki predstavljajo preddiabetike in nediagnostirane diabetike oz. skupino s tveganjem za nastanek sladkorne bolezni tipa 2. Pokazali smo uporabo tehnik uravnoteženja odločitvenega razreda in rezultate primerjali z neuravnoteženim razredom. Uravnoteženje razreda zviša klasifikacijsko uspešnost modela. Rezultate smo primerjali z rezultati drugih znanstvenih objav in zasledili podobnost med rezultati. Tuje raziskave navajajo, da je klasifikator Random Forest najpogosteje izbran model, v primerjavi z drugimi modeli za napovedovanje kroničnih bolezni. S korelacijskim testom smo pokazali, da napovedna uspešnost modela ne korelira s številom dreves v ansamblu (p = 0,00015).
Ključne besede: strojno učenje, Random Forest, neuravnoteženi podatki, diabetes mellitus
Objavljeno: 19.10.2017; Ogledov: 76; Prenosov: 34
.pdf Celotno besedilo (1,38 MB)

Iskanje izvedeno v 0.05 sek.
Na vrh
Logotipi partnerjev Univerza v Mariboru Univerza v Ljubljani Univerza na Primorskem Univerza v Novi Gorici