Naslov: | Metoda alokacije za klasifikacijo neuravnoteženih podatkov |
---|
Avtorji: | Karakatič, Sašo (Avtor) Podgorelec, Vili (Mentor) Več o mentorju...  |
---|
Datoteke: | DOK_Karakatic_Saso_2017.pdf (3,59 MB)
|
---|
Jezik: | Slovenski jezik |
---|
Vrsta gradiva: | Doktorsko delo/naloga (mb31) |
---|
Tipologija: | 2.08 - Doktorska disertacija |
---|
Organizacija: | FERI - Fakulteta za elektrotehniko, računalništvo in informatiko |
---|
Opis: | V doktorski disertaciji predstavimo metodo z imenom alokacija, ki je namenjena klasifikaciji neuravnoteženih podatkov. Metoda alokacije je klasifikacijski ansambel iz dveh nivojev. V prvem nivoju deluje alokator, ki se s pomočjo algoritmov nenadzorovanega učenja nauči učinkovito deliti izvorno množico podatkov na homogene podmnožice, ki se nato alocirajo specializiranim klasifikatorjem na drugem nivoju. Drugi nivo sestavlja množica specializiranih klasifikatorjev, kjer je vsak naučen na specifični podmnožici, ki mu je bila alocirana, in se tako specializira za točno določeno vrsto podatkov. Ti klasifikatorji tako vrnejo končno odločitev o razredu posameznih instanc, kar je tudi rezultat metode alokacije. Z namenom preizkusa delovanja koncepta metode alokacije smo v okviru doktorske disertacije razvili dve varianti alokatorja -- alokator z detekcijo anomalij, ki uporablja eno razredni klasifikator SVM, in alokator z gručenjem k-means. Obe vrsti alokatorja smo preizkusili v kombinaciji s šestimi klasifikacijskimi metodami na mestu specializiranih klasifikatorjev na drugem nivoju. Vse variante metode alokacije v vseh kombinacijah smo preverili na neuravnoteženih in uravnoteženih podatkih, slednje z namenom validacije metode kot splošnega klasifikacijskega pristopa. Rezultate alokacij smo primerjali z obstoječimi metodami za spopadanje z neuravnoteženi podatki -- informiranim podvzorčenjem, nadvzorčenjem SMOTE in ansambli bagging, MultiBoost in AdaBoost. V eksperimentih smo primerjali rezultate metrik klasifikacije (ki smo jih identificirali v teoretičnem delu disertacije) in čase, potrebne za učenje klasifikacijskega modela. Rezultate eksperimentov smo dodatno preverili s statistično analizo in na podlagi tega prišli do zaključkov, da je metoda alokacije učinkovita alternativa obstoječim pristopom pri klasifikaciji neuravnoteženih in tudi uravnoteženih podatkov. |
---|
Ključne besede: | strojno učenje, klasifikacija, neuravnoteženi podatki, detekcija anomalij, alokacija, gručenje, ansambli |
---|
Leto izida: | 2017 |
---|
Založnik: | S. Karakatič] |
---|
Izvor: | [Maribor |
---|
UDK: | 004.67:519.254(043.3) |
---|
COBISS_ID: | 20562966  |
---|
Število ogledov: | 560 |
---|
Število prenosov: | 109 |
---|
Metapodatki: |  |
---|
Področja: | KTFMB - FERI
|
---|
:
|
|
---|
| | | Skupna ocena: | (0 glasov) |
---|
Vaša ocena: | Ocenjevanje je dovoljeno samo prijavljenim uporabnikom. |
---|
Objavi na: |  |
---|
Postavite miškin kazalec na naslov za izpis povzetka. Klik na naslov izpiše
podrobnosti ali sproži prenos. |