| | SLO | ENG | Piškotki in zasebnost

Večja pisava | Manjša pisava

Izpis gradiva Pomoč

Naslov:Comparing algorithms for predictive data analytics : magistrsko delo
Avtorji:ID Kirov, Goran (Avtor)
ID Nemec Zlatolas, Lili (Mentor) Več o mentorju... Novo okno
ID Vellido Alcacena, Alfredo (Komentor)
Datoteke:.pdf MAG_Kirov_Goran_2024.pdf (2,68 MB)
MD5: F1A24F112A4E48A449FFDC0F14226F03
 
Jezik:Angleški jezik
Vrsta gradiva:Magistrsko delo/naloga
Tipologija:2.09 - Magistrsko delo
Organizacija:FERI - Fakulteta za elektrotehniko, računalništvo in informatiko
Opis:The master’s degree thesis is composed of theoretical and practical parts. The theoretical part describes the basics of predictive data analytics and machine learning algorithms for classification such as Logistic Regression, Decision Tree, Random Forest, SVM, and KNN. We also describe different evaluation metrics such as Recall, Precision, Accuracy, F1 Score, Cohen’s Kappa, Hamming Loss, and Jaccard Index that are used to measure the performance of these algorithms. Additionally, we record the time taken for the training and prediction processes to provide insights into algorithm scalability. The key part master’s thesis is the practical part that compares these algorithms with a self-implemented tool that shows results for different evaluation metrics on seven datasets. First, we describe the implementation of an application for testing where we measure evaluation metrics scores. We tested these algorithms on all seven datasets using Python libraries such as scikit-learn. Finally, w
Ključne besede:data analytics, machine learning, classification, evaluation metrics
Kraj izida:Maribor
Kraj izvedbe:Maribor
Založnik:[G. Kirov]
Leto izida:2024
Št. strani:1 spletni vir (1 datoteka PDF (IX, 58 f.))
PID:20.500.12556/DKUM-90263 Novo okno
UDK:004.6.021(043.2)
COBISS.SI-ID:225434883 Novo okno
Datum objave v DKUM:15.01.2025
Število ogledov:0
Število prenosov:52
Metapodatki:XML DC-XML DC-RDF
Področja:KTFMB - FERI
:
Kopiraj citat
  
Skupna ocena:(0 glasov)
Vaša ocena:Ocenjevanje je dovoljeno samo prijavljenim uporabnikom.
Objavi na:Bookmark and Share


Postavite miškin kazalec na naslov za izpis povzetka. Klik na naslov izpiše podrobnosti ali sproži prenos.

Licence

Licenca:CC BY-NC-ND 4.0, Creative Commons Priznanje avtorstva-Nekomercialno-Brez predelav 4.0 Mednarodna
Povezava:http://creativecommons.org/licenses/by-nc-nd/4.0/deed.sl
Opis:Najbolj omejujoča licenca Creative Commons. Uporabniki lahko prenesejo in delijo delo v nekomercialne namene in ga ne smejo uporabiti za nobene druge namene.
Začetek licenciranja:27.08.2024

Sekundarni jezik

Jezik:Slovenski jezik
Naslov:Primerjava algoritmov za napovedno analitiko podatkov
Opis:Magistrsko delo je sestavljeno iz teoretičnega in praktičnega dela, ki skupaj omogočata celovit pregled nad področjem napovedne analitike podatkov in algoritmov strojnega učenja za klasifikacijo. V teoretičnem delu se poglobljeno ukvarjamo z osnovami napovedne analitike, kjer podrobno obravnavamo glavne algoritme strojnega učenja, ki se uporabljajo za klasifikacijo podatkov. Med temi algoritmi so logistična regresija, odločitveno drevo, naključni gozd, podporni vektorski stroj (SVM) in k-najbližjih sosedov (KNN). Vsakega od teh algoritmov podrobno predstavimo z vidika njihovega delovanja, prednosti in pomanjkljivosti ter primerov uporabe, kje so najučinkovitejši. Posebna pozornost je namenjena razumevanju, kako ti algoritmi obdelujejo podatke ter kako prilagoditev njihovih parametrov vpliva na končne rezultate, kar je ključno za optimalno uporabo v različnih kontekstih in situacijah. Hkrati pa se poglobimo v teoretične osnove delovanja teh algoritmov, kar omogoča boljše razumevanje njihove praktične uporabe v različnih scenarijih. V teoretičnem delu prav tako podrobno obravnavamo različne metrike ocenjevanja, ki so ključne za merjenje uspešnosti algoritmov strojnega učenja. Te metrike vključujejo priklic, natančnost, točnost, F1 rezultat, Cohenov Kappa, Hammingova izguba in Jaccardov indeks. Vsako od teh metrik natančno predstavimo in pojasnimo njihovo matematično ozadje ter njihov vpliv na oceno delovanja algoritmov v različnih situacijah, še posebej v primerih, ko so podatki neuravnoteženi ali ko so kriteriji za uspešnost drugačni od običajnih. Posebno pozornost namenjamo tudi časovni učinkovitosti algoritmov, saj čas, potreben za učenje in napovedovanje, ponuja pomemben vpogled v njihovo razširljivost in primernost za uporabo na velikih podatkovnih nizih. Prav tako smo izpostavili pomembnost prilagoditve teh metrik glede na specifične zahteve različnih podatkovnih nizov in analitičnih ciljev, kar je ključno za pravilno interpretacijo rezultatov. Praktični del magistrske naloge je osredotočen na implementacijo in primerjavo omenjenih algoritmov v realnem okolju. Razvili smo orodje, ki omogoča samostojno izvajanje testov in prikaz rezultatov za različne metrike ocenjevanja na sedmih različnih podatkovnih nizih. V tem delu natančno opisujemo postopek razvoja in implementacije te aplikacije za testiranje, pri čemer smo uporabili več Python knjižnic, med njimi scikit-learn, ki je osrednja knjižnica za strojno učenje v Pythonu. Algoritme smo testirali na vseh sedmih podatkovnih nizih, pri čemer smo posebno pozornost namenili časovni učinkovitosti in natančnosti rezultatov. Ta dva dejavnika neposredno vplivata na razširljivost in uporabnost teh metod v realnih aplikacijah, kar je ključno za nadaljnji razvoj in uporabo tehnik strojnega učenja. Poleg tega smo v tem delu analizirali, kako razlike v podatkovnih nizih vplivajo na učinkovitost algoritmov, kar je pomembno za njihovo izbiro v specifičnih scenarijih uporabe. V zaključnem delu magistrske naloge smo izvedli poglobljeno analizo pridobljenih rezultatov, kjer smo primerjali učinkovitost posameznih algoritmov glede na različne metrike ocenjevanja. Na podlagi te analize smo oblikovali zaključke, ki nudijo poglobljen vpogled v prednosti in omejitve uporabljenih algoritmov. Ugotovili smo, da so logistična regresija, odločitveno drevo, in naključni gozd na večini testiranih podatkovnih nizov izkazali izjemno zmogljivost. Nasprotno so algoritmi, kot sta SVM in KNN, v določenih primerih dosegli nekoliko nižje ocene, kar kaže na potrebo po previdni izbiri algoritma glede na specifične značilnosti podatkov. Poleg tega smo podali priporočila za njihovo optimalno uporabo v prihodnjih raziskavah in realnih aplikacijah na področju napovedne analitike in strojnega učenja, pri čemer smo upoštevali tudi pomembne vidike, kot so robustnost, prilagodljivost, časovna učinkovitost ter praktična uporabnost teh algoritmov v različnih industrijskih sektorjih.
Ključne besede:analitika podatkov, strojno učenje, klasifikacija, metrične ocene


Komentarji

Dodaj komentar

Za komentiranje se morate prijaviti.

Komentarji (0)
0 - 0 / 0
 
Ni komentarjev!

Nazaj
Logotipi partnerjev Univerza v Mariboru Univerza v Ljubljani Univerza na Primorskem Univerza v Novi Gorici