1.
Globoko učenje in igra dama : diplomsko deloJan Popič, 2019, undergraduate thesis
Abstract: V zaključnem delu smo zasnovali računalniški program AlphaLady, ki se je sposoben naučiti igranja igre dama brez vnosa človeškega znanja. Za dosego tega smo uporabili vzpodbujevalno učenje, drevesno preiskovanje Monte Carlo in globoke konvolucijske mreže za ocenitev posameznih stanj v igri. Predstavili smo programe Alpha Go, AlphaGo Zero in AlphaZero, na podlagi katerih je zasnovan naš program. Opisali smo uporabljeno ogrodje in teoretično ozadje uporabljenih pristopov. Uspelo nam je naučiti 9 različic programa, pri čemer je vsaka naslednja različica enakovredna ali boljša kot prejšnja.
Keywords: umetna inteligenca, globoko učenje, konvolucijska nevronska mreža, drevesno preiskovanje Monte Carlo, vzpodbujevalno učenje, igra dama
Published in DKUM: 13.11.2019; Views: 2048; Downloads: 244
Full text (749,47 KB)