Să ne mai amintim de AlphaGo
KataGo și Leela ne apar mereu ân fața ochilor, dar AlphaGo s-a dus în istorie, așa că poate nu e rău să ne mai aducem aminte de el.
David Silver: AlphaGo, AlphaZero, and Deep Reinforcement Learning | Lex Fridman Podcast #86
Și a fost publicat pe 4 aprilie 2020
Mai jos aveți sumarul celor două ore.
0:00 – Introducere
4:09 – Primul program
11:11 – AlphaGo
21:42 – Regula jocului de Go
25:37 – Învățarea prin consolidare: călătorie personală
30:15 – Ce este învățarea prin consolidare?
43:51 – AlphaGo (continuare)
53:40 – Învățare supravegheată și jocul cu sine însuși în AlphaGo
1:06:12 – Lee Sedol se retrage din jocul de Go pofesionist
1:08:57 – Garry Kasparov
1:14:10 – Alpha Zero și jocul cu sine însuși
1:31:29 – Creativitate în AlphaZero
1:35:21 – Aplicații AlphaZero
1:37:59 – Funcții de recompensă
1:40:51 – Sensul vieții
După cum probabil vedeți, autorul a dezactivat redarea filmului în afara Youtube, decia trebui să îl urmăriți în altă pagină. Dar am lăsat insewrările de mai sus, poate se răzgîndește.
septembrie 6, 2021 luni at 8:01 pm