1. Fostering fairness in image classification through awareness of sensitive dataIvona Colakovic, Sašo Karakatič, 2025, izvirni znanstveni članek Opis: Machine learning (ML) has demonstrated remarkable ability to uncover hidden patterns in data. However, the presence of biases and discrimination originating from the data itself and, consequently, emerging in the ML outcomes, remains a pressing concern. With the exponential growth of unstructured data, such as images, fairness has become increasingly critical, as neural network (NN) models may inadvertently learn and perpetuate societal and historical biases. To address this challenge, we propose a fairness-aware loss function that iteratively prioritizes the worst-performing sensitive group during NN training. This approach aims to balance treatment quality across sensitive groups, achieving fairer image classification outcomes while incurring only a slight compromise in overall performance. Our method, evaluated on the FairFace dataset, demonstrates significant improvements in fairness metrics while maintaining comparable overall quality. These trade-offs highlight that the minor decrease in overall quality is justified by the improvement in fairness of the models. Ključne besede: fairness, search-basimage classification, machine learning, supervised learnign, neural networks Objavljeno v DKUM: 23.04.2025; Ogledov: 0; Prenosov: 1
Celotno besedilo (2,01 MB) |
2. Gradnja uravnoteženih evolucijskih klasifikacijskih dreves : magistrsko deloTadej Lahovnik, 2024, magistrsko delo Opis: Uspešnost odločitvenih dreves temelji na predpostavki, da učni podatki za vsak razred vključujejo enako količino informacij. Pri nesorazmerni porazdelitvi razredov so klasifikatorji pristransko usmerjeni k večinskim razredom. Zaradi majhnega števila vzorcev manjšinskih razredov klasifikatorji niso zmožni ustreznega usvajanja znanja, kar vodi do slabšega posploševanja in prekomernega prileganja. V okviru zaključnega dela smo razvili več algoritmov za gradnjo uravnoteženih evolucijskih dreves, ki se osredotočajo na reševanje izzivov, povezanih z nesorazmerno porazdelitvijo razredov. Rezultati eksperimenta kažejo, da uravnoteženost evolucijskih dreves ne prispeva k izboljšanju klasifikacije v primerjavi s tradicionalnimi metodami. Ključne besede: evolucijski algoritem, odločitvena drevesa, klasifikacija, neuravnoteženi podatki Objavljeno v DKUM: 06.02.2025; Ogledov: 0; Prenosov: 53
Celotno besedilo (2,85 MB) |
3. Pozivni injekcijski napadi na velike jezikovne modele : magistrsko deloMatic Bobnar, 2025, magistrsko delo Opis: V magistrskem delu raziskujemo vlogo velikih jezikovnih modelov v vzponu generativne umetne inteligence. Predstavimo osnovne koncepte, kot so transformerji, žetoni in vektorske reprezentacije, ter opisujemo ključne prednosti, slabosti in izzive z generativnimi modeli. Posebno pozornost namenjamo izzivom varnosti, kot so pozivni injekcijski napadi. Podrobno analiziramo delovanje teh napadov, njihove vrste in predstavimo možne pristope za obrambo pred njimi. V okviru eksperimenta prikazujemo izdelavo spletne ankete, ki implementira različne jezikovne modele. S pomočjo pridobljenih podatkov iz ankete nato analiziramo občutljivost posameznih modelov na različne intenzitete injekcijskih napadov ter preučujemo njihove vplive na uporabniške dimenzije, kot so uporabnost, točnost, razumljivost in relevantnost. Na koncu ugotavljamo, kateri modeli se najbolje odzivajo na napade in predstavljajo najvarnejšo uporabo. Ključne besede: Generativna umetna inteligenca, Generativni modeli, Veliki jezikovni modeli, Pozivni injekcijski napadi, Inženering pozivov Objavljeno v DKUM: 06.02.2025; Ogledov: 0; Prenosov: 32
Celotno besedilo (2,82 MB) |
4. |
5. Metoda kontekstno odvisne vektorske predstavitve sprememb programske kode za klasifikacijo vrste aktivnosti vzdrževanja : doktorska disertacijaTjaša Heričko, 2024, doktorska disertacija Opis: V doktorski disertaciji obravnavamo raziskovalni problem avtomatizacije prepoznavanja namenov sprememb programskih rešitev, izvedenih v fazi vzdrževanja. Klasifikacija programskih sprememb glede na vrsto aktivnosti vzdrževanja, ki odraža specifične namene sprememb, omogoča učinkovitejšo analizo in načrtovanje vzdrževanja, podpira delovne procese in naloge razvijalcev ter se pogosto uporablja v raziskavah programskega inženirstva za proučevanje sprememb in evolucije rešitev. S ciljem ugotavljanja raziskovalnih vrzeli smo s sistematičnim pregledom literature proučili obstoječe pristope h klasifikaciji sprememb programskih rešitev glede na vrsto aktivnosti vzdrževanja. Za naslovitev teh vrzeli smo s študijo sistematičnega mapiranja pregledali pristope vektorizacije sprememb programske kode z učenjem predstavitev na podlagi izvorne kode, ki se v obstoječi literaturi uporabljajo za naslavljanje različnih izzivov programskega inženirstva. Na podlagi ugotovitev smo razvili in predlagali novo metodo kontekstno odvisne vektorske predstavitve sprememb programske kode, ki omogoča ekstrakcijo semantičnih značilk sprememb izvorne kode med dvema različicama programske rešitve ob upoštevanju konteksta sprememb. Predlagana metoda predstavi spremembo programske rešitve kot množico podrobnih sorodnih sprememb programske kode, temelječih na predstavitvah zaznanih razlik v izvorni kodi na osnovi žetonov. Za ekstrakcijo semantičnih vložitev sorodnih sprememb metoda uporablja strojno učenje s prenosom znanja iz izbranega prednaučenega jezikovnega modela programske kode iz družine modelov BERT, kot so CodeBERT, UniXcoder in StarEncoder, ki je bil predhodno dodatno prilagojen ciljni nalogi s paradigmama samonadzorovanega in nadzorovanega učenja. Pridobljene vektorske vložitve podrobnih sorodnih sprememb so nato združene v enotno semantično vektorsko predstavitev spremembe programske rešitve. Za klasifikacijo sprememb programskih rešitev glede na vrsto aktivnosti vzdrževanja smo na označeni podatkovni množici izgradili modele strojnega učenja, pri čemer smo za ekstrakcijo značilk uporabili predlagano metodo ter referenčne in obstoječe metode predstavitve sprememb rešitev. Z nadzorovanim eksperimentom, študijo ablacije in primerjalno študijo smo proučili vpliv različnih parametrov predlagane metode predstavitve sprememb na uspešnost klasifikacije, primerjali uspešnost klasifikacije ob uporabi predlagane metode v primerjavi z uporabo referenčnih in obstoječih metod predstavitve sprememb ter ovrednotili uspešnost multimodalnih modelov strojnega učenja, temelječih na nadgradnji obstoječih metod predstavitve sprememb s predlagano metodo z združevanjem modalnosti naravnega jezika in programske kode. Empirične rezultate smo statistično analizirali s pomočjo frekventistične in Bayesove statistike. Izsledki raziskav potrjujejo izhodiščno tezo, da je z uporabo nove metode mogoče izgraditi modele strojnega učenja, ki uspešno klasificirajo spremembe programskih rešitev glede na vrsto aktivnosti vzdrževanja. Osrednje ugotovitve doktorske disertacije so naslednje: vektorske predstavitve sprememb programske kode na osnovi predlagane metode dosegajo primerljivo ali višjo uspešnost pri klasifikaciji v primerjavi s predstavitvami na osnovi referenčnih in obstoječih metod; zmanjšanje dimenzionalnosti kontekstno odvisnih vektorskih predstavitev sprememb omogoča zmanjšanje števila dimenzij brez negativnega vpliva na uspešnost klasifikacije; multimodalni klasifikacijski modeli dosegajo višjo uspešnost klasifikacije v primerjavi z unimodalnimi modeli. Ključne besede: vzdrževanje programske opreme, spremembe programskih rešitev, rudarjenje repozitorijev programskih rešitev, strojno učenje, klasifikacija, nevronski jezikovni modeli programske kode, vektorske predstavitve, vektorska vložitev Objavljeno v DKUM: 06.01.2025; Ogledov: 0; Prenosov: 78
Celotno besedilo (5,56 MB) |
6. Analiza uporabe umetne inteligence v slovenskih medijih : graduation thesisŽiga Kapun, 2024, diplomsko delo Opis: Uporaba umetne inteligence je prisotna že na nešteto področjih, kjer se uporablja za najrazličnejše namene. Najdemo jo lahko v optimizaciji procesov, pregledovanju velikih količin podatkov ter tudi ustvarjanju vsebin. Podobno kot na drugih področjih, se je umetna inteligenca, ali AI, uveljavila tudi na področju medijev. Tako se diplomska naloga posveča prav uporabi AI na področju medijev v Sloveniji. Naloga le-te je predstaviti vrste AI in možnosti, ki jih slednja omogoča medijem, prav tako pa z analizo ankete predstavi dejansko stanje uporabe AI v Sloveniji. Ključne besede: umetna inteligenca - AI, mediji, generativna AI, strojno učenje, globoko učenje Objavljeno v DKUM: 14.11.2024; Ogledov: 0; Prenosov: 100
Celotno besedilo (2,03 MB) |
7. Učinkovitost avtomatiziranega oblikovanja testnih primerov s pomočjo velikih jezikovnih modelovJovana Murdjeva, 2024, magistrsko delo Opis: V magistrskem delu je bila raziskana uporabo ChatGPT-ja kot veliki jezikovni model za avtomatizirano oblikovanje testnih primerov v primerjavi s tradicionalnimi metodami, ki jih uporabljajo strokovnjaki za testiranje programske opreme. Delo se je osredotočilo na vpliv natančno opredeljenih pozivov (inženiring pozivov) na kakovost, pokritost kode in učinkovitost pri odkrivanju napak. Rezultati raziskave kažejo, da ChatGPT z ustrezno oblikovanimi vnosnimi zahtevami dosega primerljivo ali celo boljšo uspešnost kot ročno oblikovani testi, kar pomeni velik potencial za optimizacijo procesov testiranja programske opreme. Ključne besede: avtomatizirano testiranje, veliki jezikovni modeli, inženiring pozivov, ChatGPT, kakovost testnih primerov Objavljeno v DKUM: 22.10.2024; Ogledov: 0; Prenosov: 49
Celotno besedilo (1,31 MB) |
8. Strategije prilagajanja izhodov velikih jezikovnih modelovBard Grujič, 2024, magistrsko delo Opis: Namen magistrskega dela je sistematično predstaviti, raziskati in analizirati delovanje velikih jezikovnih modelov, s posebnim poudarkom na modelu transformatorja, ter raziskati, kako prilagoditi izhode teh modelov za specifične potrebe organizacij. V praksi bomo preučili, kako ta prilagoditev deluje, tako da bomo razvili in demonstrirali aplikacijo za iskanje ključnih besed po dokumentih v PDF formatu z uporabo velikega jezikovnega modela GPT-4 podjetja OpenAI. Ključne besede: veliki jezikovni modeli, modeli obdelave naravnega jezika, umetna inteligenca, inženiring spodbud Objavljeno v DKUM: 19.09.2024; Ogledov: 0; Prenosov: 23
Celotno besedilo (2,79 MB) |
9. Primerjava pristopov gručenja z algoritmi po vzoru iz naraveDavid Mikek, 2024, magistrsko delo Opis: V tem delu smo se lotili gručenja s petimi različnimi algoritmi po vzoru iz narave. V ta namen smo razvili štiri različne pristope za njihovo uporabo pri reševanju problema gručenja. Njihovo učinkovitost smo preverili z eksperimentom nad šestimi različnimi podatkovnimi seti in na koncu izvedli primerjavo. Ugotovili smo, da lahko algoritmi po vzoru iz narave učinkovito rešujejo problem gručenja, vendar na rezultate in čas izvajanja močno vpliva izbira pristopa in algoritma. Ključne besede: gručenje, algoritmi po vzoru iz narave Objavljeno v DKUM: 19.09.2024; Ogledov: 0; Prenosov: 16
Celotno besedilo (5,16 MB) |
10. Kako poštena so klasifikacijska odločitvena drevesa?Andrej Kostić, 2024, magistrsko delo Opis: Poštenost klasifikacijskih odločitvenih dreves je na področju strojnega učenja postala kritično vprašanje. Klasifikacijska in regresijska drevesa (CART) so znana po svoji preprostosti in učinkovitosti pri obravnavanju klasifikacijskih in regresijskih nalog. Vendar lahko ti modeli nehote ohranijo ali celo povečajo pristranskost, prisotno v podatkih, kar vodi do nepoštenih odločitev, ki nesorazmerno prizadenejo določene skupine. To magistrsko delo raziskuje poštenost modelov CART z implementacijo metode FairCART, ki vključuje omejitve poštenosti med postopkom oblikovanja dreves. V delu je ocenjena učinkovitost metode FairCART pri zmanjševanju pristranskosti ob hkratnem ohranjanju kakovosti odločitev, kar omogoča vpogled v kompromise med poštenostjo in točnostjo. Implementacija in rezultati eksperimenta kažejo, da lahko metoda FairCART zmerno zmanjša pristranskost in ohrani splošno kakovost odločitvenega drevesa. Ključne besede: klasifikacijska in regresijska drevesa, poštenost v strojnem učenju, CART, FairCART Objavljeno v DKUM: 19.09.2024; Ogledov: 0; Prenosov: 28
Celotno besedilo (3,47 MB) |