1. Metoda kontekstno odvisne vektorske predstavitve sprememb programske kode za klasifikacijo vrste aktivnosti vzdrževanja : doktorska disertacijaTjaša Heričko, 2024, doktorska disertacija Opis: V doktorski disertaciji obravnavamo raziskovalni problem avtomatizacije prepoznavanja namenov sprememb programskih rešitev, izvedenih v fazi vzdrževanja. Klasifikacija programskih sprememb glede na vrsto aktivnosti vzdrževanja, ki odraža specifične namene sprememb, omogoča učinkovitejšo analizo in načrtovanje vzdrževanja, podpira delovne procese in naloge razvijalcev ter se pogosto uporablja v raziskavah programskega inženirstva za proučevanje sprememb in evolucije rešitev. S ciljem ugotavljanja raziskovalnih vrzeli smo s sistematičnim pregledom literature proučili obstoječe pristope h klasifikaciji sprememb programskih rešitev glede na vrsto aktivnosti vzdrževanja. Za naslovitev teh vrzeli smo s študijo sistematičnega mapiranja pregledali pristope vektorizacije sprememb programske kode z učenjem predstavitev na podlagi izvorne kode, ki se v obstoječi literaturi uporabljajo za naslavljanje različnih izzivov programskega inženirstva. Na podlagi ugotovitev smo razvili in predlagali novo metodo kontekstno odvisne vektorske predstavitve sprememb programske kode, ki omogoča ekstrakcijo semantičnih značilk sprememb izvorne kode med dvema različicama programske rešitve ob upoštevanju konteksta sprememb. Predlagana metoda predstavi spremembo programske rešitve kot množico podrobnih sorodnih sprememb programske kode, temelječih na predstavitvah zaznanih razlik v izvorni kodi na osnovi žetonov. Za ekstrakcijo semantičnih vložitev sorodnih sprememb metoda uporablja strojno učenje s prenosom znanja iz izbranega prednaučenega jezikovnega modela programske kode iz družine modelov BERT, kot so CodeBERT, UniXcoder in StarEncoder, ki je bil predhodno dodatno prilagojen ciljni nalogi s paradigmama samonadzorovanega in nadzorovanega učenja. Pridobljene vektorske vložitve podrobnih sorodnih sprememb so nato združene v enotno semantično vektorsko predstavitev spremembe programske rešitve. Za klasifikacijo sprememb programskih rešitev glede na vrsto aktivnosti vzdrževanja smo na označeni podatkovni množici izgradili modele strojnega učenja, pri čemer smo za ekstrakcijo značilk uporabili predlagano metodo ter referenčne in obstoječe metode predstavitve sprememb rešitev. Z nadzorovanim eksperimentom, študijo ablacije in primerjalno študijo smo proučili vpliv različnih parametrov predlagane metode predstavitve sprememb na uspešnost klasifikacije, primerjali uspešnost klasifikacije ob uporabi predlagane metode v primerjavi z uporabo referenčnih in obstoječih metod predstavitve sprememb ter ovrednotili uspešnost multimodalnih modelov strojnega učenja, temelječih na nadgradnji obstoječih metod predstavitve sprememb s predlagano metodo z združevanjem modalnosti naravnega jezika in programske kode. Empirične rezultate smo statistično analizirali s pomočjo frekventistične in Bayesove statistike. Izsledki raziskav potrjujejo izhodiščno tezo, da je z uporabo nove metode mogoče izgraditi modele strojnega učenja, ki uspešno klasificirajo spremembe programskih rešitev glede na vrsto aktivnosti vzdrževanja. Osrednje ugotovitve doktorske disertacije so naslednje: vektorske predstavitve sprememb programske kode na osnovi predlagane metode dosegajo primerljivo ali višjo uspešnost pri klasifikaciji v primerjavi s predstavitvami na osnovi referenčnih in obstoječih metod; zmanjšanje dimenzionalnosti kontekstno odvisnih vektorskih predstavitev sprememb omogoča zmanjšanje števila dimenzij brez negativnega vpliva na uspešnost klasifikacije; multimodalni klasifikacijski modeli dosegajo višjo uspešnost klasifikacije v primerjavi z unimodalnimi modeli. Ključne besede: vzdrževanje programske opreme, spremembe programskih rešitev, rudarjenje repozitorijev programskih rešitev, strojno učenje, klasifikacija, nevronski jezikovni modeli programske kode, vektorske predstavitve, vektorska vložitev Objavljeno v DKUM: 06.01.2025; Ogledov: 0; Prenosov: 26 Celotno besedilo (5,56 MB) |
2. Implementacija grafa raztrosa in grafa grupirane matrike v ogrodju NiaARM za vizualizacijo asociacijskih pravilMiha Bukovnik, 2024, diplomsko delo Opis: Podatkovno rudarjenje je ključnega pomena za pridobivanje dragocenih informacij iz velikih podatkovnih zbirk, s široko uporabo na različnih področjih. Rudarjenje asociacijskih pravil odkriva vzorce in povezave v podatkih, kar je izredno uporabno v telekomunikacijah, tržni analizi, upravljanju tveganj ter drugih področjih. Vizualizacija teh pravil z grafom raztrosa in grafom grupirane matrike omogoča boljše razumevanje in analizo pravil. Cilj diplomskega dela je implementacija omenjenih vizualizacijskih tehnik v ogrodju NiaARM, vključno s primerjalno analizo vizualizacij iz paketa arulesViz. Ugotovitve nakazujejo na uporabnost tako NiaARMa kot arulesViza s svojimi specifičnostmi. Medtem ko ogrodje NiaARM omogoča visoko stopnjo interaktivnosti in prilagodljivosti v vizualizaciji, pa paket arulesViz, z večjo podporo skupnosti in dodatnimi viri pomoči, ponuja hitrejše in zanesljivejše vizualizacije. Ključne besede: asociacijska pravila, rudarjenje asociacijskih pravil, vizualizacijske tehnike, graf, NiaARM Objavljeno v DKUM: 22.10.2024; Ogledov: 0; Prenosov: 7 Celotno besedilo (1,71 MB) |
3. Metode za napovedovanje intervalnih spremenljivk na družboslovnih podatkih : diplomsko delo visokošolskega študijskega programa Informacijska varnostDanijel Blagojević, 2024, diplomsko delo Opis: Diplomsko delo obravnava uporabo metod podatkovnega rudarjenja za napovedovanje intervalnih spremenljivk v družboslovnih podatkovnih množicah, kjer je analiza velikih in kompleksnih podatkov pogosto izziv. Podatkovno rudarjenje omogoča odkrivanje skritih vzorcev in povezav, ki jih z običajnimi metodami analize težko zaznamo, ter omogoča napovedovanje prihodnjih dogodkov na osnovi preteklih podatkov. V nalogi so preučene različne metode, kot so linearna regresija, nevronske mreže, metoda k najbližjih sosedov (kNN), podporni vektorji (SVM) in odločitvena drevesa, pri čemer se raziskuje njihova učinkovitost pri obdelavi družboslovnih podatkov.
Naloga vključuje primerjavo učinkovitosti teh metod z uporabo različnih metrik, kot so MSE, RMSE, MAE in R2, ki zagotavljajo celovito oceno natančnosti napovedi. Rezultati kažejo, da so nevronske mreže in linearna regresija med najuspešnejšimi metodami za napovedovanje intervalnih spremenljivk v družboslovnih podatkovnih množicah. Nevronske mreže izkazujejo posebno prednost pri odkrivanju skritih vzorcev v kompleksnih podatkovnih strukturah, medtem ko je linearna regresija učinkovita zaradi svoje preprostosti in razumljivosti.
Raziskava poudarja pomen prilagajanja izbranih metod značilnostim podatkovnih množic in potrebam analize. Izpostavlja tudi, da lahko ustrezna izbira metode vpliva na uspešnost napovedovanja in natančnost pridobljenih rezultatov. S tem prispeva k razumevanju optimalnih pristopov za analizo družboslovnih podatkov in odpira možnosti za nadaljnje raziskave, zlasti pri uporabi naprednejših tehnik strojnega učenja in prilagoditvah obstoječih metod. Naloga tako ponuja smernice za izbiro ustreznih metod podatkovnega rudarjenja glede na zahteve družboslovnih raziskav in spodbuja nadaljnje raziskovalno delo na tem področju. Ključne besede: podatkovno rudarjenje, metode, družboslovje, množice, metrike, diplomske naloge Objavljeno v DKUM: 27.09.2024; Ogledov: 0; Prenosov: 21 Celotno besedilo (1006,06 KB) |
4. Uporaba metod strojnega učenja za oblikovanje profila obremenitve spletnih aplikacijYauhen Unuchak, 2024, magistrsko delo Opis: V magistrskem delu je predstavljen razvoj modelov gručenja s pomočjo programskega jezika Python. Cilj dela je razviti prototip orodij za oblikovanje profila obremenitve pri testiranju zmogljivosti spletnih aplikacij na podlagi analize preteklega delovanja spletne aplikacije v produkcijskem okolju.
Izdelava profila obremenitve za testiranje zmogljivosti spletnih aplikacij predstavlja ključno fazo obremenitvenega testiranja. Ta faza omogoča usklajevanje testnih podatkov in obsega z zahtevami naročnika ter dejanskimi uporabniškimi izkušnjami. Pri izdelavi profila je treba upoštevati uporabniške vloge, tipične scenarije delovanja in razmerje med različnimi scenariji, saj različne funkcionalnosti aplikacije porabijo različne vire strežnika.
Obremenitveno testiranje vključuje simulacijo uporabniških scenarijev s specializirano programsko opremo, kot sta JMeter in LoadRunner. To rešitev lahko uporabljajo inženirji in IT-strokovnjaki pri oblikovanju profila obremenitve, ki se ukvarjajo z obremenitvenim testiranjem zmogljivosti spletnih aplikacij.
V delu raziskujemo, kako odkriti uporabniške vzorce za izboljšanje oblikovanja profila obremenitve za testiranje zmogljivosti na podlagi analize zapisov (rudarjenja podatkov iz log-datotek) o delovanju spletne aplikacije v produkcijskem okolju. S pravilno zasnovanim profilom obremenitve je mogoče oceniti zmogljivost in stabilnost sistema ter simulirati realne uporabniške pogoje. Ključne besede: profil obremenitve spletnih aplikacij, testiranje, podatkovno rudarjenje spletnih zapisov Objavljeno v DKUM: 05.07.2024; Ogledov: 106; Prenosov: 11 Celotno besedilo (8,02 MB) |
5. Iskanje skritih informacij v meritvah kvalitete zraka s pomočjo podatkovnega rudarjenja : diplomsko deloVito Abeln, 2023, diplomsko delo Opis: Diplomska naloga predstavlja postopek iskanja skritih podatkov iz meritev kvalitete zraka s pomočjo rudarjenja asociativnih pravil. Rudarjenje asociativnih pravil je tehnika, preko katere lahko pridobimo zanimive povezave med podatki iz večjih podatkovnih množic. V zaključnem delu smo prikazali postopek pridobivanja podatkov, obdelavo podatkov, razlago uporabljenih algoritmov in njihovo implementacijo. Opisali smo algoritme Apriori, ECLAT in Fp-growth, ki se uporabljajo pri asociativnem rudarjenju pravil. Predstavili smo tudi numerično rudarjenje asociativnih pravil, pri katerem smo uporabili algoritem optimizacije roja delcev. Rezultati rudarjenja so razkrili različne povezave med vrednostmi meritev, ki smo jih razložili in vizualizirali s pomočjo raznih grafov. Ključne besede: rudarjenje asociativnih pravil, kvaliteta zraka, asociativna pravila Objavljeno v DKUM: 03.11.2023; Ogledov: 642; Prenosov: 62 Celotno besedilo (2,94 MB) |
6. Analiza tehnologij za rudarjenje kriptovalut : diplomsko deloMatic Macedoni, 2023, diplomsko delo Opis: Rudarjenje kriptovalut je ključni proces v tehnologiji veriženja blokov, kateri omogoča varno in zanesljivo potrjevanje transakcij ter vzdrževanje konsenza med omrežjem. Analiza tehnologij rudarjenja kriptovalut je ključnega pomena za razumevanje delovanja teh omrežij in njihove učinkovitosti. Na začetku so predstavljeni tehnologija veriženja blokov, njeno delovanje, prednosti in slabosti. V drugem delu so najprej opisane kriptovalute na splošno, nato pa še štiri specifične kriptovalute: Bitcoin Cash, DigiByte, Ravencoin in Ethereum Classic. Na koncu so predstavljeni še eksperimentalni poskusi na različnih grafičnih pospeševalnikih in aplikacijsko-specifičnih integriranih vezjih in rezultati dobljenih poskusov. Ključne besede: veriženje blokov, kriptovaluta, rudarjenje kriptovalut, grafični pospeševalniki, aplikacijsko-specifično integrirano vezje Objavljeno v DKUM: 12.10.2023; Ogledov: 469; Prenosov: 47 Celotno besedilo (1,72 MB) |
7. Okoljska degradacija kot posledica rudarjenja v Zasavju : magistrsko deloDejan Rašković, 2023, magistrsko delo Opis: V magistrski nalogi smo analizirali in predstavili razvoj dogajanja v zasavski regiji po odločitvi, da se gre v likvidacijo družbe RTH in hkrati v zaključitev dejavnosti rudarjenja, ki je predstavljala del zasavske tradicije okoli 250 let. Rudarjenje je dolgo časa predstavljalo temelj ekonomskega, sociološkega, kulturološkega in vsakega drugega razvoja Zasavja. Država je po odločitvi o zaprtju rudnika sprejela Zakon o postopnem zapiranju rudnika Trbovlje - Hrastnik in postopnem prestrukturiranju regije. Navedeni zakon je bil sprejet z namenom, da bi stanje okolja po rudarjenju v največji možni meri povrnili v prvotno stanje, obenem pa je država želela preprečiti tudi ekonomski zlom Zasavske regije in potencialno težko socialno situacijo. Sama magistrska naloga je v veliki meri vezana na preučevanje uspešnosti implementacije navedenega zakona v praksi, saj so od navedenega procesa bili v največji meri odvisni tudi nadaljnji ekonomski razvoj, naravovarstvena dejavnosti in kakovost samega življenja v Zasavski regiji po obdobju rudarjenja. Skozi naše preučevanje navedenega področja smo poskušali ugotoviti, v kolikšni meri je rudarska dejavnost trajno degradirala okolje. Zanimala sta nas uspešnost samega procesa zapiranja rudnika ter v kolikšni meri je bilo uspešno izvedeno razvojno prestrukturiranje zasavske regije. Ko govorimo o sanaciji degradiranega okolja kot tudi o prestrukturiranju regije, menimo, da ta dva procesa še nista popolnoma zaključena. Po našem mnenju država po odločitvi o likvidaciji družbe RTH ni imela pravega odgovora za reševanje problemov, ki so nastali z odločitvijo o zaključku rudarske dejavnosti. Rešitve, ki so bile predlagane v Zakonu o postopnem zapiranju Rudnika Trbovlje - Hrastnik in razvojnem prestrukturiranju regije, so bile nezadostne za reševanje prihajajočih problemov v regiji, obenem pa so bila nezadostna tudi sredstva, ki so bila namenjena za njihovo uveljavitev v praksi. Da so naše ugotovitve pravilne, nakazujejo številni ekonomski in demografski podatki, ki smo jih skozi magistrsko nalogo tudi prikazali in podrobneje preučili. Po zaključku magistrske naloge smo dobili vtis, da je Zasavje v obdobju rudarjenja dalo veliko žrtev za celotno državo, vendar ne moremo reči, da se je enako zgodilo tudi v obratni smeri po končanju rudniške dejavnosti. Ključne besede: okoljska degradacija, rudarjenje, prestrukturiranje, sanacija, onesnaženost, magistrska dela Objavljeno v DKUM: 02.06.2023; Ogledov: 502; Prenosov: 59 Celotno besedilo (737,50 KB) |
8. Optimizacija geotermalne elektrarne v El Salvadorju z ozirom na termodinamiko in rudarjenje Bitcoina : magistrsko deloAndrej Zidarič, 2023, magistrsko delo Opis: V okviru magistrske naloge smo analizirali delovanje geotermalne elektrarne, natančneje uporabo organskega Rankinovega cikla za izkoriščenje geotermalne energije. Magistrska naloga je osnovana na realnem primeru geotermalne elektrarne v El Salvadorju. V magistrski nalogi smo zasnovali ORC sistem iz vidika termodinamike in s programom Matlab optimizirali maksimalni in minimalni tlak sistema ter njegovo maksimalno temperaturo. Poskušali smo najti najučinkovitejšo delovno tekočino, ki bo omogočila maksimalno učinkovitost sistema. Rezultate pridobljene s pomočjo Matlaba smo validirali s programoma Aspen Plus in DWSIM.
Kot rezultat optimizacije in validacije smo ugotovili, da so najučinkovitejše delovne tekočine za zasnovo ORC sistema n-butan, R245fa in izobutan. Vse tri delovne tekočine so varne, imajo nizek potencial globalnega segrevanja in ničen potencial tanjšanja ozona. Povprečna učinkovitost ORC sistema, dobljena z njihovo uporabo, je znašala malo več kot 12 %.
Hipotetični primer uporabe geotermalne elektrarne v El Salvadorju smo predpostavili z namenom rudarjenja kriptovalute Bitcoin. Za izračune smo ustvarili matematične funkcije predvidevanja cene in težavnosti rudarjenja do leta 2050. Ugotovili smo, da bi bil tovrsten projekt izvedljiv in profitabilen. Ključne besede: Organski Rankinov cikel, Geotermalna energija, Optimizacija, Matlab, Bitcoin, rudarjenje Bitcoina Objavljeno v DKUM: 16.02.2023; Ogledov: 728; Prenosov: 99 Celotno besedilo (7,43 MB) |
9. Lastnosti biofizikalnih objav skozi čas : magistrsko deloDino Gačević, 2022, magistrsko delo Opis: V zadnjih letih beležimo porast števila strokovnih in znanstvenih objav, sočasno s tem pa tudi število novo nastalih, interdisciplinarnih področij. Sem uvrščamo tudi področje biofizike, izbrano za izhodiščno točko naše raziskave. V magistrskem delu smo najprej z uporabo podatkovnega rudarjenja iz spletne baze PubMed pridobili nabor za področje relevantnih člankov, nato pa pripravili splošni pregled od leta 1900 naprej. Ugotovili smo, da je število objavljenih člankov, povprečno število avtorjev na članek ter delež člankov s ključnimi besedami skozi leta naraščal. S podatki o revijah z največ objavljenimi članki ter najpogostejšimi ključnimi besedami smo ponazorili trende, ki odražajo postopen prehod naravnanosti v splošno fiziko do specializiranosti v področje biofizike. Enak trend smo potrdili še z najpogostejšimi n-grami skozi leta ter analizo MeSH deskriptorjev. Podrobneje smo predstavili tudi trende držav z največ objavami ter ugotovili, da so do leta 2020 prednjačile ZDA, po letu 2020 pa je vodilno mesto prevzela Kitajska. Ogledali smo si še medsebojno povezovanje avtorjev oz. držav, iz katerih ti prihajajo. Z delitvijo rezultatov v tri obdobja smo prikazali postopno krepitev medsebojnega povezovanja. Nalogo smo zaokrožili s prikazom razvoja in trendov področja biofizike na podlagi analize MeSH deskriptorjev. Rezultati so pokazali, da se velik delež terminov prenese v nova obdobja. Povprečno se pojavi 21 % novih ter pozabi 11 % vseh terminov. Z analizo ugotovljenih terminov se je izkazalo, da močno prevladuje termin »strunarji«, ki poudarja področje biologije, za področje fizike pa so se kot najpomembnejši termini izkazali »algoritmi«, »epidemiološke metode« ter »akustika«, nedavno pa tudi »avtomatizacija«. Ključne besede: podatkovno rudarjenje, analiza besedila, MeSH, kompleksne mreže Objavljeno v DKUM: 28.10.2022; Ogledov: 729; Prenosov: 58 Celotno besedilo (3,24 MB) |
10. CRISP-DM procesni model za podatkovno rudarjenjeTadej Roškarič, 2022, diplomsko delo Opis: Z vedno večjim napredkom tehnologije je na voljo vse več kapacitet za shranjevanje in analizo podatkov, pri čemer podatkovne baze postajajo vse kompleksnejše in iz tega razloga potrebujemo standardizirane postopke za analitično procesiranje. Medpanožni standardni postopek za podatkovno rudarjenje CRISP-DM (angl. Cross-Industry Standard Process for Data Mining) je primer tovrstnega standarda, ki je od njegovega nastanka leta 1996 še vedno med glavnimi procesnimi modeli na področju podatkovnega rudarjenja v vseh gospodarskih sektorjih. V tem diplomskem delu opredelimo njegove posamezne faze in korake ter jih podrobno opišemo. Ker podatkovno rudarjenje zaradi njegove poslovne vrednosti pridobiva vedno večji pomen, se na tem področju pojavlja vse več alternativ, zato CRISP-DM primerjamo z modeloma SEMMA (angl. Sample, Explore, Modify, Model, Assess) in ASUM-DM (angl. Analytics Solutions Unified Method for Data Mining) z zaključkom, da slednja nista dovolj fleksibilna za status splošnega standarda. Pregledali smo ustrezno literaturo in opravili študijo primera, v kateri smo optimizirali marketinško kampanjo za bančne storitve na podlagi podatkov portugalske finančne institucije. Po analizi literature in končanem praktičnem primeru smo pretehtali vpliv posameznih faz na kakovost rezultatov in ugotovili, da je v akademskem svetu najmanj pokrita prav faza uvedbe, ki pa je v praksi nepogrešljivega pomena. Prav tako smo izpostavili nekatere ključne pomanjkljivosti, ki znotraj originalnega CRISP-DM procesnega modela niso rešene. V ta namen smo predlagali dodatne korake, kot so postopek zbiranja podatkov, razširitev procesa uvedbe modela in nova faza podatkovne etike. Na podlagi teh predlogov ugotavljamo, da potreba po razširitvi prvotnega CRISP-DM modela obstaja. Ključne besede: CRISP-DM, podatkovno rudarjenje, Python, procesni model, strojno učenje Objavljeno v DKUM: 13.10.2022; Ogledov: 571; Prenosov: 55 Celotno besedilo (2,24 MB) Gradivo ima več datotek! Več... |