| | SLO | ENG | Cookies and privacy

Bigger font | Smaller font

Search the digital library catalog Help

Query: search in
search in
search in
search in
* old and bologna study programme

Options:
  Reset


1 - 2 / 2
First pagePrevious page1Next pageLast page
1.
Strojno učenje računalniškega igralca v igri Havannah
Nino Serec, 2020, undergraduate thesis

Abstract: V zadnjih letih je bil na področju umetne inteligence z uporabo okrepitvenega učenja nevronskih mrež dosežen preboj pri sposobnostih računalnika za igranje iger na deski, kot je Go, pri katerih je bil človek doslej močnejši nasprotnik. V diplomskem delu raziščemo algoritem igranja iger AlphaZero, ki kombinira tehnike preiskovanja dreves Monte Carlo in okrepitvenega učenja nevronskih mrež. Algoritem začne brez posebnega predznanja o dobrih strategijah, vendar se moč algoritma s postopkom učenja, ki se ponavlja iterativno, konstantno povečuje. V diplomskem delu opišemo in implementiramo osnovno obliko AlphaZero za igranje igre Havannah. Naučimo več različic modela nevronskih mrež, kjer vsak naslednik premaga svojega prednika in postane prvak. S tem pokažemo, da se lahko računalniški igralec uči igranja igre Havannah samo s podanimi pravili igre, tako da je sposoben premagati povprečnega človeškega igralca.
Keywords: igra Havannah, drevesno preiskovanje Monte Carlo, nevronske mreže, okrepitveno učenje, tabula rasa
Published: 11.11.2020; Views: 248; Downloads: 48
.pdf Full text (1,29 MB)

2.
Drevesno preiskovanje Monte Carlo v igri Havannah
Vanesa Krajnc, 2018, undergraduate thesis

Abstract: V diplomskem delu predstavimo namizno igro Havannah in algoritem drevesnega preiskovanja Monte Carlo. Slednji je v zadnjih letih pripomogel k občutno boljši zmogljivosti računalniških igralcev v kompleksnih namiznih igrah s popolno informacijo, med katere spada tudi Havannah. Implementiramo tri računalniške igralce igre Havannah: prvi uporablja osnovno različico drevesnega preiskovanja Monte Carlo, drugi uporablja algoritem hitrega ocenjevanja vrednosti akcij, tretji pa kombinacijo drevesnega preiskovanja Monte Carlo s hitrim ocenjevanjem vrednosti akcij. Na koncu primerjamo vse tri igralce v medsebojnih igrah in v igrah proti človeškemu nasprotniku.
Keywords: igra na deski Havannah, drevesno preiskovanje Monte Carlo, hitro ocenjevanje vrednosti akcij, igre s popolno informacijo
Published: 14.11.2018; Views: 670; Downloads: 111
.pdf Full text (1,47 MB)

Search done in 0.07 sec.
Back to top
Logos of partners University of Maribor University of Ljubljana University of Primorska University of Nova Gorica