著者・出版社・関連アーティスト
商品説明
人気シリーズの第4弾。今回のテーマは強化学習です。実際のコードを提示し動かしながら学ぶという本シリーズのスタイルを踏襲し、外部ライブラリに頼らず、強化学習を支える基本的な技術やアイデアをゼロから実装しながら学びます。本書では読者が強化学習独特の理論を確実にマスターできるように、強化学習という難解なテーマの構成要素の一つひとつを「理論」と「実践」の双方から丁寧に解説します。数式だけで説明する理論書とは異なり、読者はコードを通してハッとする気づきを数多く得られるでしょう。
関連記事
収録内容
1 | 1章 バンディット問題 |
2 | 2章 マルコフ決定過程 |
3 | 3章 ベルマン方程式 |
4 | 4章 動的計画法 |
5 | 5章 モンテカルロ法 |
6 | 6章 TD法 |
7 | 7章 ニューラルネットワークとQ学習 |
8 | 8章 DQN |
9 | 9章 方策勾配法 |
10 | 10章 さらに先へ |
11 | 付録 |