著者・出版社・関連アーティスト
商品説明
強化学習の難解な理論を平均を入口としてやさしく解説。原理→数式→プログラムの流れで全体像を直感的に把握できます。
関連記事
収録内容
1 | 第1章 平均で学ぶ強化学習の基本概念(平均と期待値 |
2 | 平均と価値 ほか) |
3 | 第2章 各アルゴリズムの特徴と応用(強化学習における方策π(a|S) |
4 | 動的計画法 ほか) |
5 | 第3章 関数近似手法(関数近似の基本概念 |
6 | 関数近似モデルを用いたV(St)の表現 ほか) |
7 | 第4章 深層強化学習の原理と手法(TD‐Q学習法におけるNNによる行動価値関数の回帰 |
8 | DQNによる行動状態価値関数の近似 ほか) |