| | SLO | ENG | Piškotki in zasebnost

Večja pisava | Manjša pisava

Iskanje po katalogu digitalne knjižnice Pomoč

Iskalni niz: išči po
išči po
išči po
išči po
* po starem in bolonjskem študiju

Opcije:
  Ponastavi


1 - 6 / 6
Na začetekNa prejšnjo stran1Na naslednjo stranNa konec
1.
Globoko okrepitveno učenje za igranje iger na podlagi video vhoda
Monika Bozhinova, 2021, magistrsko delo

Opis: V magistrskem delu smo se ukvarjali z okrepitvenim učenjem agentov za igranje računalniških iger. V ta namen smo implementirali tri modele agenta, ki temeljijo na uporabi nevronske mreže za aproksimacijo funkcije vrednosti akcij, in predlagali lastno izboljšano arhitekturo dvobojevalne dvojne Q-mreže. Učenje smo izvajali na igrah Pong in Beamrider iz nabora iger Atari 2600. Ugotovili smo, da z našim pristopom dosežemo boljšo zmogljivost agenta kot globoka Q-mreža, dvojna globoka Q-mreža in dvojna globoka Q-mreža z dvobojevalno arhitekturo v igri Pong, medtem ko se v igri Beamrider agent uči počasneje, predvidoma zaradi šuma v drugačni predstavitvi stanja, ki ga predlagani model uporablja.
Ključne besede: globoko okrepitveno učenje, nevronske mreže, globoka Q-mreža, dvobojevalna arhitektura, igre Atari, Pong, Beamrider
Objavljeno: 20.10.2021; Ogledov: 92; Prenosov: 20
.pdf Celotno besedilo (2,16 MB)

2.
Uporaba okrepitvenega učenja za optimizacijo krmiljenja semaforjev
Žiga Sušin, 2021, diplomsko delo

Opis: V tej nalogi bomo podrobno preučili metodo okrepitvenega učenja in načine implementacije le-tega. Nato ga bomo uporabili za rešitev zadanega problema, ki je optimizacija krmiljenja semaforjev v križišču. V naslednjih poglavjih bomo na splošno opisali strojno učenje, podrobneje pa okrepitveno učenje. Opisali bomo tudi način implementacije v programskem jeziku Python in knjižnice, ki nam pomagajo pri tem. V drugem delu naloge bomo izdelali program s pomočjo pridobljenega znanja. Na koncu pa bomo še predstavili rezultate simulacij.
Ključne besede: Okrepitveno učenje, umetna inteligenca, promet, Python
Objavljeno: 18.10.2021; Ogledov: 68; Prenosov: 7
.pdf Celotno besedilo (1,21 MB)

3.
Strojno učenje računalniškega igralca v igri s kartami
Mai Praskalo, 2021, diplomsko delo

Opis: V diplomski nalogi predstavljamo več različnih implementacij strojnega učenja računalniškega igralca za igranje igre s kartami Uno. Vsi uporabljeni algoritmi so s področja okrepitvenega učenja, saj so klasični algoritmi, ki se zanašajo na iskanje optimalne poteze na podlagi popolne informacije, neprimerni za igre z nepopolnimi informacijami. Algoritme smo primerjali glede na uspešnost v igranju proti igralcu, ki izbira naključne poteze, ter glede na krivuljo učenja, ki prikazuje pridobljeno povprečno kumulativno nagrado med procesom učenja.
Ključne besede: okrepitveno učenje, igra Uno, igre z nepopolnimi informacijami, igre s kartami, nevronske mreže
Objavljeno: 18.10.2021; Ogledov: 59; Prenosov: 7
.pdf Celotno besedilo (901,04 KB)

4.
Okrepitveno učenje agentov za igranje iger v pogonu Unity
Jan Banko, 2021, magistrsko delo

Opis: V magistrskem delu obravnavamo algoritme okrepitvenega učenja na primeru igranja računalniških iger. Namen magistrskega dela je implementacija igre v okolju Unity in analiza učinkovitosti algoritmov okrepitvenega učenja računalniškega igralca. Opisane so teoretične osnove okrepitvenega učenja, podrobneje pa so predstavljeni algoritmi PPO (angl. Proximal Policy Optimization), SAC (angl. Soft Actor Critic) in DQN (angl. Deep Q-Network), ki so uporabljeni v končni analizi. Rezultati so pokazali, da je bilo učenje agenta v celoti gledano uspešno. V testnem okolju se je najbolje odrezal algoritem PPO, z uporabo katerega je naučen agent v povprečju dosegal 86,4% maksimalne možne nagrade, najslabše pa algoritem DQN, ki ni primeren za uporabo v implementiranem testnem okolju.
Ključne besede: okrepitveno učenje, računalniške igre, Unity, agent, strojno učenje
Objavljeno: 17.06.2021; Ogledov: 189; Prenosov: 45
.pdf Celotno besedilo (1,04 MB)

5.
Strojno učenje računalniškega igralca v igri Havannah
Nino Serec, 2020, diplomsko delo

Opis: V zadnjih letih je bil na področju umetne inteligence z uporabo okrepitvenega učenja nevronskih mrež dosežen preboj pri sposobnostih računalnika za igranje iger na deski, kot je Go, pri katerih je bil človek doslej močnejši nasprotnik. V diplomskem delu raziščemo algoritem igranja iger AlphaZero, ki kombinira tehnike preiskovanja dreves Monte Carlo in okrepitvenega učenja nevronskih mrež. Algoritem začne brez posebnega predznanja o dobrih strategijah, vendar se moč algoritma s postopkom učenja, ki se ponavlja iterativno, konstantno povečuje. V diplomskem delu opišemo in implementiramo osnovno obliko AlphaZero za igranje igre Havannah. Naučimo več različic modela nevronskih mrež, kjer vsak naslednik premaga svojega prednika in postane prvak. S tem pokažemo, da se lahko računalniški igralec uči igranja igre Havannah samo s podanimi pravili igre, tako da je sposoben premagati povprečnega človeškega igralca.
Ključne besede: igra Havannah, drevesno preiskovanje Monte Carlo, nevronske mreže, okrepitveno učenje, tabula rasa
Objavljeno: 11.11.2020; Ogledov: 371; Prenosov: 64
.pdf Celotno besedilo (1,29 MB)

6.
Trgovanje kriptovalut z okrepitvenim učenjem
Gašper Reher, 2020, diplomsko delo

Opis: V diplomskem delu se bom seznanil in preizkusil okrepitveno učenje na časovnih podatkih, natančneje na trgovanju s kriptovalutami. V okviru naloge bom naredil teoretičen pregled okrepitvenega učenja, ogrodji okrepitvenega učenja in pregled knjižnic, ki že obstajajo na področju okrepitvenega učenja ter trgovanja s kriptovalutami. Praktični cilj diplomskega dela pa je izdelava programa, ki se bo na podlagi zgodovinskih vrednosti kriptovalut, naučil, kako trgovati z njimi, tako da zagotovi velik dobiček.
Ključne besede: Okrepitveno učenje, kriptovalute, Python, umetna inteligenca
Objavljeno: 03.11.2020; Ogledov: 2263; Prenosov: 108
.pdf Celotno besedilo (1,66 MB)
Gradivo ima več datotek! Več...

Iskanje izvedeno v 0.09 sek.
Na vrh
Logotipi partnerjev Univerza v Mariboru Univerza v Ljubljani Univerza na Primorskem Univerza v Novi Gorici