Să ne mai amintim de AlphaGo

KataGo și Leela ne apar mereu ân fața ochilor, dar AlphaGo s-a dus în istorie, așa că poate nu e rău să ne mai aducem aminte de el.

David Silver este un nume care poate nu îți spune nimic, nici mie de altfel, dar figura sa îmi este cunoscută, el fiind adeseori prezent în interviurile cu Demis Hassabis.

Aici, el nu mai este alături de Demis, fiind în prim plan.

Pe parcursul a două ore aflăm cum de a ajuns el să fie o piesă principală în dezvoltarea AlphaGo.

Interviul se numește

David Silver: AlphaGo, AlphaZero, and Deep Reinforcement Learning | Lex Fridman Podcast #86

Și a fost publicat pe 4 aprilie 2020

https://youtu.be/uPUEq8d73JI

Mai jos aveți sumarul celor două ore.

0:00 – Introducere

4:09 – Primul program

11:11 – AlphaGo

21:42 – Regula jocului de Go

25:37 – Învățarea prin consolidare: călătorie personală

30:15 – Ce este învățarea prin consolidare?

43:51 – AlphaGo (continuare)

53:40 – Învățare supravegheată și jocul cu sine însuși în AlphaGo

1:06:12 – Lee Sedol se retrage din jocul de Go pofesionist

1:08:57 – Garry Kasparov

1:14:10 – Alpha Zero și jocul cu sine însuși

1:31:29 – Creativitate în AlphaZero

1:35:21 – Aplicații AlphaZero

1:37:59 – Funcții de recompensă

1:40:51 – Sensul vieții

După cum probabil vedeți, autorul a dezactivat redarea filmului în afara Youtube, decia trebui să îl urmăriți în altă pagină. Dar am lăsat insewrările de mai sus, poate se răzgîndește.

Sep

Posted:

September 6, 2021 Monday at 8:01 pm

Categories: Diverse Tags: Diverse

Costel

BrăilaGo

Brăila, Go, restul se înţelege

Să ne mai amintim de AlphaGo

David Silver: AlphaGo, AlphaZero, and Deep Reinforcement Learning | Lex Fridman Podcast #86

Leave a Reply Cancel reply

Recent Posts

Recent Comments

Menu

Calendar

Recent Posts