著者・出版社・関連アーティスト
商品説明
MDPでモデル化するための地力を養う。強化学習・深層強化学習のしくみの理解にも役に立つ。アルゴリズムの徹底詳説×豊富な応用事例。
関連記事
収録内容
1 | マルコフ決定過程とは |
2 | マルコフ決定過程の基本的な問題設定とアルゴリズム |
3 | マルコフ決定過程の基本的な機械学習 |
4 | 真のパラメータが変化するマルコフ決定過程 |
5 | 状態、行動、利得に関する工夫 |
6 | 推薦システムへの適用―基本的な非割引問題 |
7 | 金融工学への適用―基本的な割引問題 |
8 | ロールプレイングゲームへの適用―複数の情報で構成される状態+複数の独立な試行で構成される状態遷移確率によるモデル |
9 | 通信工学への適用―複数の情報で構成される状態+少数のパラメータで構成される状態遷移確率によるモデル |
10 | ベイズ流の仮説検定への適用―最後の期においてのみ利得が発生するモデル(基礎) |
11 | 教育工学への適用―最後の期においてのみ利得が発生するモデル(発展) |
12 | 設備保全、アセットマネジメントとヘルスケア支援への適用―良好な状態維持が目的のモデル |
13 | 深層強化学習の入口 |
14 | 付録A マルコフ連鎖 |
15 | 付録B 隠れマルコフモデル |
16 | 付録C ベイズ統計と統計的決定理論 |
close