| | SLO | ENG | Piškotki in zasebnost

Večja pisava | Manjša pisava

Izpis gradiva

Naslov:Strojno učenje računalniškega igralca v igri havannah
Avtorji:Serec, Nino (Avtor)
Strnad, Damjan (Mentor) Več o mentorju... Novo okno
Datoteke:.pdf UN_Serec_Nino_2020.pdf (1,29 MB)
 
Jezik:Slovenski jezik
Vrsta gradiva:Diplomsko delo/naloga (mb11)
Tipologija:2.11 - Diplomsko delo
Organizacija:FERI - Fakulteta za elektrotehniko, računalništvo in informatiko
Opis:V zadnjih letih je bil na področju umetne inteligence z uporabo okrepitvenega učenja nevronskih mrež dosežen preboj pri sposobnostih računalnika za igranje iger na deski, kot je Go, pri katerih je bil človek doslej močnejši nasprotnik. V diplomskem delu raziščemo algoritem igranja iger AlphaZero, ki kombinira tehnike preiskovanja dreves Monte Carlo in okrepitvenega učenja nevronskih mrež. Algoritem začne brez posebnega predznanja o dobrih strategijah, vendar se moč algoritma s postopkom učenja, ki se ponavlja iterativno, konstantno povečuje. V diplomskem delu opišemo in implementiramo osnovno obliko AlphaZero za igranje igre Havannah. Naučimo več različic modela nevronskih mrež, kjer vsak naslednik premaga svojega prednika in postane prvak. S tem pokažemo, da se lahko računalniški igralec uči igranja igre Havannah samo s podanimi pravili igre, tako da je sposoben premagati povprečnega človeškega igralca.
Ključne besede:igra Havannah, drevesno preiskovanje Monte Carlo, nevronske mreže, okrepitveno učenje, tabula rasa
Leto izida:2020
Izvor:Maribor
NUK URN:URN:SI:UM:DK:HGVJIGUO
Licenca:CC BY 4.0
To delo je dosegljivo pod licenco Creative Commons Priznanje avtorstva 4.0 Mednarodna
Število ogledov:54
Število prenosov:12
Metapodatki:XML RDF-CHPDL DC-XML DC-RDF
Področja:KTFMB - FERI
:
  
Skupna ocena:(0 glasov)
Vaša ocena:Ocenjevanje je dovoljeno samo prijavljenim uporabnikom.
Objavi na:AddThis
AddThis uporablja piškotke, za katere potrebujemo vaše privoljenje.
Uredi privoljenje...

Postavite miškin kazalec na naslov za izpis povzetka. Klik na naslov izpiše podrobnosti ali sproži prenos.

Sekundarni jezik

Jezik:Angleški jezik
Naslov:Machine learning of computer player in havannah game
Opis:In recent years, in the field of artificial intelligence, the reinforcement learning of neural networks has been used to achieve a breakthrough in the ability of the computer players to play board games, such as Go, in which human has been a stronger opponent. In this thesis, we explore the AlphaZero algorithm, which combines Monte Carlo tree search and reinforced neural network learning. The algorithm starts without any special prior knowledge of good strategies, but the algorithm becomes stronger with a learning process that repeats iteratively. In this thesis, we implement the basic form of AlphaZero for playing the Havannah game. Several versions of the neural network model are trained to play the game, where each successor defeats its predecessor and becomes the champion, thus showing that a computer player can learn to play the Havannah game and win against a human player, simply by being given the rules of the game and not possessing any special prior knowledge of good strategies.
Ključne besede:Havannah, Monte Carlo tree search, neural networks, reinforced learning, tabula rasa


Komentarji

Dodaj komentar

Za komentiranje se morate prijaviti.

Komentarji (0)
0 - 0 / 0
 
Ni komentarjev!

Nazaj
Logotipi partnerjev Univerza v Mariboru Univerza v Ljubljani Univerza na Primorskem Univerza v Novi Gorici