JMANI

Lecture 6: Q-Network by Sung Kim 본문

AI/Reinforcement Learning

Lecture 6: Q-Network by Sung Kim

jmani 2022. 5. 23. 17:50

Q-Network training: 상태를 입력으로 받아 가능한 모든 q-value 를 얻음

theta는 network의 weight

theta를 최소화 시키기 위해 학습

알고리즘

Comments