1. Primerjava pristopov gručenja z algoritmi po vzoru iz naraveDavid Mikek, 2024, master's thesis Abstract: V tem delu smo se lotili gručenja s petimi različnimi algoritmi po vzoru iz narave. V ta namen smo razvili štiri različne pristope za njihovo uporabo pri reševanju problema gručenja. Njihovo učinkovitost smo preverili z eksperimentom nad šestimi različnimi podatkovnimi seti in na koncu izvedli primerjavo. Ugotovili smo, da lahko algoritmi po vzoru iz narave učinkovito rešujejo problem gručenja, vendar na rezultate in čas izvajanja močno vpliva izbira pristopa in algoritma. Keywords: gručenje, algoritmi po vzoru iz narave Published in DKUM: 19.09.2024; Views: 0; Downloads: 11 Full text (5,16 MB) |
2. Implementacija k-means gručenja z genetskim algoritmomAlen Šaruga, 2024, undergraduate thesis Abstract: K-means algoritem je eden najpopularnejših in najučinkovitejših algoritmov gručenja podatkov. Kljub temu algoritem predstavlja izziv, saj je občutljiv na začetno postavitev centroidov gruč. Zato lahko algoritem stremi k lokalnemu optimumu in ne h globalno optimalni rešitvi. Namen diplomskega dela je implementacija optimiziranega k-means algoritma, manj občutljivega na začetne centroide gruč, z uporabo genetskega algoritma. Delo se osredotoča na postopek gručenja in genetski algoritem. Implementacija je izvedena v programskem jeziku Python s knjižnico NiaPy. Na koncu so predstavljeni rezultati eksperimentov, kjer je izvedena primerjava standardnega in optimiziranega k-means algoritma na različnih podatkovnih množicah. Keywords: gručenje, k-means, genetski algoritem, centroidi Published in DKUM: 19.09.2024; Views: 0; Downloads: 16 Full text (1,34 MB) |
3. Algoritmi gručenja v okolju Jamovi in programskem jeziku R : diplomsko deloTine Šuster, 2022, undergraduate thesis Abstract: Gručenje je uporabna tehnika strojnega učenja. Velika količina podatkov, ki so na voljo odpira mnogo možnosti za iskanje skritega znanja. Ti pogoji ponujajo priložnost razvoja odprtokodnih orodij za uporabo strojnega učenja in ga tako približati več uporabnikom. Opisali smo osnove strojnega učenja in podrobneje analizirali nekaj algoritmov gručenja. V programskem jeziku R smo razvili vtičnik za odprtokodno okolje Jamovi. Končni izdelek podpira tri pogosto uporabljane algoritme gručenja in omogoča uporabniko enostavno gručenje nad podatki prav tako pa oceno pridobljenih rezultatov. Uporabniško izkušnjo smo izboljšali tudi z grafičnim prikazom podatkov. Keywords: gručenje, analiza, strojno učenje, vtičnik Published in DKUM: 13.01.2023; Views: 645; Downloads: 85 Full text (1,47 MB) |
4. Obdelava in gručenje naravnih besedil v programskem okolju python : diplomsko deloEva Štingl, 2022, undergraduate thesis Abstract: Strojno učenje, ki se ukvarja z obravnavo naravnega jezika, je vseprisotno v našem vsakdanjiku. V tem diplomskem delu smo si podrobno pogledali kaj je naravni jezik in kaj zajema njegova obravnava. Opisali smo knjižnice za delo z njim in jih primerjali. Prav tako pa smo opredelili tip nenadzorovanega učenja – gručenja, ki se pogosto uporablja nad naravnimi besedili. V okviru dela smo opisali postopek gručenja in nekaj algoritmov. Nad scenarijem celotne serije Igra prestolov smo izvedli sentimentalno analizo stavkov in opravili gručenje nad podatki. Narisani grafi, so nam pokazali zanimiv rezultate gručenja po sentimentih. Gruče smo kontekstualizirali s pomočjo poznavanja vsebine serije in dogajanja v njej. Keywords: gručenje, obdelava naravnega jezika, predprocesiranje besedila, knjižnice za obdelavo naravnega jezika, metoda voditeljev Published in DKUM: 24.10.2022; Views: 694; Downloads: 60 Full text (3,98 MB) |
5. Paralelni algoritem diferencialne evolucije in gručenja za multimodalno optimizacijo : diplomsko deloTilen Ravnak, 2021, undergraduate thesis Abstract: V diplomskem delu predstavljamo implementacijo paralelne različice algoritma diferencialne evolucije in gručenja za multimodalno optimizacijo. Algoritem smo paralelizirali tako na centralni procesni enoti kot na grafični procesni enoti. Za paralelizacijo na centralni procesni enoti smo uporabili knjižnico thread (niti), ki je del programskega jezika C++. Za paralelizacijo na grafični procesni enoti smo uporabili ogrodje CUDA. Uspešnost algoritma smo testirali na izbranih optimizacijskih problemih tekmovanja CEC 2013. Najvišji faktor pohitritve smo dosegli pri problemu Modified Rastrigin in sicer 2,799. Keywords: Diferencialna evolucija, gručenje, paralelizacija Published in DKUM: 18.10.2021; Views: 813; Downloads: 48 Full text (1,23 MB) |
6. Razvoj klasifikacijskega modela za računalniško opremoBojan Perko, 2021, master's thesis Abstract: Zaključna naloga obravnava načrtovanje in razvoj celovite rešitve, ki vključuje razvoj več
razrednega klasifikacijskega modela in razvoj modelov razvrščanja v skupine z uporabo
strojnega učenja.
Glavni namen rešitve je nadomestitev ročnega uvrščanja podatkov o računalniških
izdelkih v vnaprej določene skupine izdelkov, in sicer z avtomatizirano celovito rešitvijo,
katere namen je izboljšanje procesa izračuna indeksa cen življenjskih potrebščin. Izdelki,
razvrščeni v skupine, so namreč osnova za zajem podatkov pri izračunu indeksa cen
življenjskih potrebščin, ki se uporablja za merilo inflacije.
Rešitev smo razvili po metodologiji CRISP-DM, z uporabo različnih tehnologij, in sicer
relacijske podatkovne baze Microsoft SQL Server, ogrodja .NET Core, ogrodja ML.NET in
programskega jezika C#.
Rezultat zaključnega dela je celovita rešitev, ki omogoča samodejno izvajanje napovedi
oziroma klasifikacije podatkov o računalniških izdelkih ter v nadaljevanju združevanje teh
podatkov v homogene skupine, hkrati pa preko aplikacijskega vmesnika uporabnikom
omogoča nadzor nad izvajanjem delovanja rešitve.
Rešitev, ki smo jo razvili v zaključni nalogi, pripomore k bolj konsistentni, kakovostni in
učinkoviti obdelavi podatkov ter s tem olajša delo pri naročniku. Možnosti nadaljnjega
razvoja se kažejo v več segmentih, pri čemer je bistvenega pomena uporaba večje
količine podatkov in s tem bolj natančna klasifikacija. Keywords: strojno učenje, klasifikacija, gručenje, ML.NET, podatkovna baza Published in DKUM: 18.08.2021; Views: 1337; Downloads: 81 Full text (2,09 MB) |
7. Izboljšana metoda stiskanja risanih slik : magistrsko deloAljaž Jeromel, 2019, master's thesis Abstract: V magistrskem delu opišemo izboljšave algoritma stiskanja risanih slik, ki smo ga predstavili v diplomski nalogi. Z uporabo osemsmerne povezanosti pikslov, združevanjem verižnih kod in optimizacijo zapisa RLE izboljšamo učinkovitost stiskanja, medtem ko z uporabo gručenja in uteženega združevanja območij uravnavamo kakovost rekonstrukcije slike. Pokažemo, da izboljšan algoritem risane slike stisne učinkoviteje, kot algoritem brez izboljšav, prav tako pa bolje ohrani podrobnosti v slikah. Učinkovitost izboljšanega algoritma primerjamo tudi s sorodnimi metodami stiskanja risanih slik, algoritmom PNG in standardom JPEG. Ugotovili smo, da učinkovitost predstavljenega algoritma na risanih slikah večkratno presega učinkovitosti vseh primerjanih metod. Keywords: Stiskanje slik, verižne kode, gručenje, transformacije nizov. Published in DKUM: 10.05.2019; Views: 1460; Downloads: 132 Full text (2,54 MB) |
8. Uporaba orodja Orange za podatkovno rudarjenjeDamir Kos, 2017, undergraduate thesis Abstract: Ob vse večjem številu informacij, ki krožijo na najrazličnejše načine, je podatkovno rudarjenje za uspešno in učinkovito rabo informacij ključnega pomena. Preko podatkovnega rudarjenja namreč dosežemo rezultate, s katerimi ugotovimo ustreznost informacij, odpravimo pomanjkljivosti, poiščemo vzorce, znanje in podobno.
V diplomskem delu je predstavljen program Orange, delo z njim, njegova uporaba ter nekatere lastnosti. Glavni segmenti podatkovnega rudarjenja s programom Orange, ki so predstavljeni v diplomskem delu, so klasifikacija, gručenje in pred procesiranje podatkov.
Praktični del diplomskega dela, ki je hkrati ključen, je razdeljen na tri dele. Prvi del predstavlja vse tri glavne segmente preko uporabniškega vmesnika, drugi del preko kode, v tretjem delu pa se nato prikaže izgradnja lastnega modula in njegova uporaba. Keywords: podatkovno rudarjenje, orodje Orange, klasifikacija, gručenje, predprocesiranje podatkov Published in DKUM: 24.10.2017; Views: 2506; Downloads: 353 Full text (2,35 MB) |
9. Metoda alokacije za klasifikacijo neuravnoteženih podatkovSašo Karakatič, 2017, doctoral dissertation Abstract: V doktorski disertaciji predstavimo metodo z imenom alokacija, ki je namenjena klasifikaciji neuravnoteženih podatkov. Metoda alokacije je klasifikacijski ansambel iz dveh nivojev. V prvem nivoju deluje alokator, ki se s pomočjo algoritmov nenadzorovanega učenja nauči učinkovito deliti izvorno množico podatkov na homogene podmnožice, ki se nato alocirajo specializiranim klasifikatorjem na drugem nivoju. Drugi nivo sestavlja množica specializiranih klasifikatorjev, kjer je vsak naučen na specifični podmnožici, ki mu je bila alocirana, in se tako specializira za točno določeno vrsto podatkov. Ti klasifikatorji tako vrnejo končno odločitev o razredu posameznih instanc, kar je tudi rezultat metode alokacije. Z namenom preizkusa delovanja koncepta metode alokacije smo v okviru doktorske disertacije razvili dve varianti alokatorja -- alokator z detekcijo anomalij, ki uporablja eno razredni klasifikator SVM, in alokator z gručenjem k-means. Obe vrsti alokatorja smo preizkusili v kombinaciji s šestimi klasifikacijskimi metodami na mestu specializiranih klasifikatorjev na drugem nivoju. Vse variante metode alokacije v vseh kombinacijah smo preverili na neuravnoteženih in uravnoteženih podatkih, slednje z namenom validacije metode kot splošnega klasifikacijskega pristopa. Rezultate alokacij smo primerjali z obstoječimi metodami za spopadanje z neuravnoteženi podatki -- informiranim podvzorčenjem, nadvzorčenjem SMOTE in ansambli bagging, MultiBoost in AdaBoost. V eksperimentih smo primerjali rezultate metrik klasifikacije (ki smo jih identificirali v teoretičnem delu disertacije) in čase, potrebne za učenje klasifikacijskega modela. Rezultate eksperimentov smo dodatno preverili s statistično analizo in na podlagi tega prišli do zaključkov, da je metoda alokacije učinkovita alternativa obstoječim pristopom pri klasifikaciji neuravnoteženih in tudi uravnoteženih podatkov. Keywords: strojno učenje, klasifikacija, neuravnoteženi podatki, detekcija anomalij, alokacija, gručenje, ansambli Published in DKUM: 10.05.2017; Views: 2820; Downloads: 457 Full text (3,59 MB) |
10. GRUČNI INDEKSI V PODATKOVNIH BAZAHNina Novinšek, 2013, undergraduate thesis Abstract: V diplomskem delu smo predstavili gručene indekse. Opisali smo postopek načrtovanja podatkovne baze in našteli nekaj korakov v življenjskem ciklu podatkovne baze, kjer moramo pretehtati uporabnost gručenega indeksa. Opisali smo teoretične razlike med gručenim ter ne-gručenim indeksom in prikazali razlike v številu logičnih in fizičnih branj na izbranih poizvedbah. Prikazali smo učinek gručenega indeksa glede na tri različne razvrstitve podatkov in učinek reorganizacije podatkov v tabelah z in brez gručenega indeksa. Keywords: gručeni indeksi, gručenje, grozdenje, DB2, fizična organizacija podatkov Published in DKUM: 14.01.2014; Views: 1426; Downloads: 122 Full text (1,65 MB) |