これからの強化学習 [525回参照されました]
H. Tarkunさん がこの本を手に取りました。H. Tarkunさんは、これまでに601冊の本を読み、192,344ページをめくりました。
本の紹介
32% [全320ページ(残り220ページ)]
状態 読んでいるところ
積ん読時間:積ん読1年以上
著者 牧野 貴樹 ブックリンクされた本
-評価
未評価感想
読書の軌跡
8ページ | 2016/11/03 23:44:59 | 多腕バンディット問題、greedyアルゴリズム |
21ページ | 2016/11/06 14:52:29 |
23ページ | 2016/11/08 01:50:20 |
29ページ | 2016/11/13 01:26:25 |
36ページ | 2016/11/21 00:46:13 | ベルマン方程式、Sarsa |
41ページ | 2016/11/27 15:03:00 | 価値反復法による方策の獲得 |
46ページ | 2016/12/04 01:40:06 | 方策勾配に基づく強化学習 |
51ページ | 2016/12/06 00:46:10 |
57ページ | 2016/12/11 10:22:03 | 部分観測マルコフ決定過程 |
60ページ | 2016/12/19 02:18:37 | belief state |
72ページ | 2016/12/24 22:20:54 |
74ページ | 2017/01/02 17:10:38 |
79ページ | 2017/01/14 02:03:11 |
83ページ | 2017/01/22 11:29:05 |
100ページ | 2017/08/13 14:46:44 |
コメント
コメントするにはログインが必要です。