1. Uporaba drevesnega preiskovanja Monte Carlo za inteligentno vodenje igralnih agentov v Rogue-podobnih igrahBenjamin Jeran, 2024, undergraduate thesis Abstract: V diplomski nalogi smo se osredotočili na implementacijo igralnega agenta za Rogue-podobne igre. V teoretičnem delu smo najprej opisali, kaj so Rogue-podobne igre ter izpostavili njihove glavne značilnosti. Naredili smo pregled igralnih agentov in njihovih pristopov ter se na koncu dotaknili osnovne implementacije algoritma drevesnega preiskovanja Monte Carlo, pri katerem smo uporabili formulo UCT za izbiranje vozlišč. V praktičnem delu smo s pomočjo algoritma zgradili igralnega agenta za Rogue-podobno igro ter naredili raziskavo, kako dobro se je ta obnesel v igranju. Raziskovali smo, kako dobro se agent na podlagi algoritma MCTS izkaže proti igranju nasprotnika, ki izbira naključne poteze. Algoritem MCTS se je ob koncu praktičnega dela dobro izkazal za uporabo v Rogue-podobnih igrah. Keywords: Rogue-podobne igre, MCTS, inteligentno vodenje agentov, okrepitveno učenje Published in DKUM: 08.10.2024; Views: 0; Downloads: 6 Full text (2,00 MB) |
2. Uporaba okrepitvenega učenja pri učenju igralnih agentov v borilnih igrah : magistrsko deloTomi Milošič, 2023, master's thesis Abstract: V tej magistrski nalogi smo se osredotočili na razvoj igralnega agenta z uporabo okrepitvenega učenja in posebej obravnavali vprašanje, ali so ti agenti dosegli ali presegli raven profesionalnih človeških igralcev. Delo je razdeljeno na teoretični in praktični del. Teoretični del zajema osnovne koncepte okrepitvenega učenja in opisuje uporabljena orodja. V praktičnem delu smo izvedli tri eksperimente z različnimi velikostmi korakov in časi usposabljanja modela ter nato primerjali njihovo uspešnost. Naša analiza kaže, da se v našem konkretnem primeru s povečevanjem časa učenja pri uporabi tehnik okrepitvenega učenja postopoma približujemo optimalnim rezultatom. Naša raziskava potrjuje učinkovitost okrepitvenega učenja pri oblikovanju igralnih agentov, katerih primerjava je relevantna zgolj ob zadostnem obsegu usposabljanja. Keywords: Okrepitveno učenje, igralni lik, borilne igre, Gym Retro, PPO Published in DKUM: 12.10.2023; Views: 357; Downloads: 95 Full text (1,85 MB) |
3. Učenje nevronske mreže za igranje preproste arkadne igre : diplomsko deloMitja Polner, 2022, undergraduate thesis Abstract: V diplomskem delu smo izdelali nevronsko mrežo in preprosto arkadno videoigro Bomberman, katero se je nevronska mreža naučila igrati. Videoigro smo izdelali s pomočjo odprtokodnega ogrodja LibGdx v programskem jeziku Java. Implementirali smo lastno nevronsko mrežo in nevronsko mrežo s knjižnico PyTorch. Obe mreži se učita po principu okrepitvenega učenja. Rezultate lastne implementacije nevronske mreže smo primerjali z rezultati nevronske mreže implementirane s knjižnico PyTorch. Ugotovili smo, da so si rezultati obeh mrež zelo podobni. Nevronska mreža po tridesetih minutah učenja uspe počistiti polovico vseh uničljivih zidov. Keywords: arkadna videoigra, Bomberman, nevronska mreža, okrepitveno učenje, globoka Q-mreža Published in DKUM: 24.10.2022; Views: 605; Downloads: 52 Full text (3,00 MB) |
4. Globoko okrepitveno učenje za igranje iger na podlagi video vhoda : magistrsko deloMonika Bozhinova, 2021, master's thesis Abstract: V magistrskem delu smo se ukvarjali z okrepitvenim učenjem agentov za igranje računalniških iger. V ta namen smo implementirali tri modele agenta, ki temeljijo na uporabi nevronske mreže za aproksimacijo funkcije vrednosti akcij, in predlagali lastno izboljšano arhitekturo dvobojevalne dvojne Q-mreže. Učenje smo izvajali na igrah Pong in Beamrider iz nabora iger Atari 2600. Ugotovili smo, da z našim pristopom dosežemo boljšo zmogljivost agenta kot globoka Q-mreža, dvojna globoka Q-mreža in dvojna globoka Q-mreža z dvobojevalno arhitekturo v igri Pong, medtem ko se v igri Beamrider agent uči počasneje, predvidoma zaradi šuma v drugačni predstavitvi stanja, ki ga predlagani model uporablja. Keywords: globoko okrepitveno učenje, nevronske mreže, globoka Q-mreža, dvobojevalna arhitektura, igre Atari, Pong, Beamrider Published in DKUM: 20.10.2021; Views: 974; Downloads: 88 Full text (2,16 MB) |
5. Uporaba okrepitvenega učenja za optimizacijo krmiljenja semaforjev : diplomsko deloŽiga Sušin, 2021, undergraduate thesis Abstract: V tej nalogi bomo podrobno preučili metodo okrepitvenega učenja in načine implementacije le-tega. Nato ga bomo uporabili za rešitev zadanega problema, ki je optimizacija krmiljenja semaforjev v križišču. V naslednjih poglavjih bomo na splošno opisali strojno učenje, podrobneje pa okrepitveno učenje. Opisali bomo tudi način implementacije v programskem jeziku Python in knjižnice, ki nam pomagajo pri tem. V drugem delu naloge bomo izdelali program s pomočjo pridobljenega znanja. Na koncu pa bomo še predstavili rezultate simulacij. Keywords: Okrepitveno učenje, umetna inteligenca, promet, Python Published in DKUM: 18.10.2021; Views: 1099; Downloads: 65 Full text (1,21 MB) |
6. Strojno učenje računalniškega igralca v igri s kartami : diplomsko deloMai Praskalo, 2021, undergraduate thesis Abstract: V diplomski nalogi predstavljamo več različnih implementacij strojnega učenja računalniškega igralca za igranje igre s kartami Uno. Vsi uporabljeni algoritmi so s področja okrepitvenega učenja, saj so klasični algoritmi, ki se zanašajo na iskanje optimalne poteze na podlagi popolne informacije, neprimerni za igre z nepopolnimi informacijami. Algoritme smo primerjali glede na uspešnost v igranju proti igralcu, ki izbira naključne poteze, ter glede na krivuljo učenja, ki prikazuje pridobljeno povprečno kumulativno nagrado med procesom učenja. Keywords: okrepitveno učenje, igra Uno, igre z nepopolnimi informacijami, igre s kartami, nevronske mreže Published in DKUM: 18.10.2021; Views: 900; Downloads: 32 Full text (901,04 KB) |
7. Okrepitveno učenje agentov za igranje iger v pogonu Unity : magistrsko deloJan Banko, 2021, master's thesis Abstract: V magistrskem delu obravnavamo algoritme okrepitvenega učenja na primeru igranja računalniških iger. Namen magistrskega dela je implementacija igre v okolju Unity in analiza učinkovitosti algoritmov okrepitvenega učenja računalniškega igralca. Opisane so teoretične osnove okrepitvenega učenja, podrobneje pa so predstavljeni algoritmi PPO (angl. Proximal Policy Optimization), SAC (angl. Soft Actor Critic) in DQN (angl. Deep Q-Network), ki so uporabljeni v končni analizi. Rezultati so pokazali, da je bilo učenje agenta v celoti gledano uspešno. V testnem okolju se je najbolje odrezal algoritem PPO, z uporabo katerega je naučen agent v povprečju dosegal 86,4% maksimalne možne nagrade, najslabše pa algoritem DQN, ki ni primeren za uporabo v implementiranem testnem okolju. Keywords: okrepitveno učenje, računalniške igre, Unity, agent, strojno učenje Published in DKUM: 17.06.2021; Views: 1042; Downloads: 120 Full text (1,04 MB) |
8. Strojno učenje računalniškega igralca v igri Havannah : diplomsko deloNino Serec, 2020, undergraduate thesis Abstract: V zadnjih letih je bil na področju umetne inteligence z uporabo okrepitvenega učenja nevronskih mrež dosežen preboj pri sposobnostih računalnika za igranje iger na deski, kot je Go, pri katerih je bil človek doslej močnejši nasprotnik. V diplomskem delu raziščemo algoritem igranja iger AlphaZero, ki kombinira tehnike preiskovanja dreves Monte Carlo in okrepitvenega učenja nevronskih mrež. Algoritem začne brez posebnega predznanja o dobrih strategijah, vendar se moč algoritma s postopkom učenja, ki se ponavlja iterativno, konstantno povečuje.
V diplomskem delu opišemo in implementiramo osnovno obliko AlphaZero za igranje igre Havannah. Naučimo več različic modela nevronskih mrež, kjer vsak naslednik premaga svojega prednika in postane prvak. S tem pokažemo, da se lahko računalniški igralec uči igranja igre Havannah samo s podanimi pravili igre, tako da je sposoben premagati povprečnega človeškega igralca. Keywords: igra Havannah, drevesno preiskovanje Monte Carlo, nevronske mreže, okrepitveno učenje, tabula rasa Published in DKUM: 11.11.2020; Views: 1180; Downloads: 92 Full text (1,29 MB) |
9. Trgovanje kriptovalut z okrepitvenim učenjem : diplomsko deloGašper Reher, 2020, undergraduate thesis Abstract: V diplomskem delu se bom seznanil in preizkusil okrepitveno učenje na časovnih podatkih, natančneje na trgovanju s kriptovalutami. V okviru naloge bom naredil teoretičen pregled okrepitvenega učenja, ogrodji okrepitvenega učenja in pregled knjižnic, ki že obstajajo na področju okrepitvenega učenja ter trgovanja s kriptovalutami. Praktični cilj diplomskega dela pa je izdelava programa, ki se bo na podlagi zgodovinskih vrednosti kriptovalut, naučil, kako trgovati z njimi, tako da zagotovi velik dobiček. Keywords: Okrepitveno učenje, kriptovalute, Python, umetna inteligenca Published in DKUM: 03.11.2020; Views: 3182; Downloads: 229 Full text (1,66 MB) This document has many files! More... |