1.
Globoko okrepitveno učenje za igranje iger na podlagi video vhoda : magistrsko deloMonika Bozhinova, 2021, magistrsko delo
Opis: V magistrskem delu smo se ukvarjali z okrepitvenim učenjem agentov za igranje računalniških iger. V ta namen smo implementirali tri modele agenta, ki temeljijo na uporabi nevronske mreže za aproksimacijo funkcije vrednosti akcij, in predlagali lastno izboljšano arhitekturo dvobojevalne dvojne Q-mreže. Učenje smo izvajali na igrah Pong in Beamrider iz nabora iger Atari 2600. Ugotovili smo, da z našim pristopom dosežemo boljšo zmogljivost agenta kot globoka Q-mreža, dvojna globoka Q-mreža in dvojna globoka Q-mreža z dvobojevalno arhitekturo v igri Pong, medtem ko se v igri Beamrider agent uči počasneje, predvidoma zaradi šuma v drugačni predstavitvi stanja, ki ga predlagani model uporablja.
Ključne besede: globoko okrepitveno učenje, nevronske mreže, globoka Q-mreža, dvobojevalna arhitektura, igre Atari, Pong, Beamrider
Objavljeno v DKUM: 20.10.2021; Ogledov: 443; Prenosov: 58
Celotno besedilo (2,16 MB)