Neuro-Dynamic Programming
Neuro-Dynamic Programming (Optimization and Neural Computation Series, 3)
- 作者: Dimitri P. Bertsekas,John N. Tsitsiklis
- 出版社/メーカー: Athena Scientific
- 発売日: 1996/10/01
- メディア: ハードカバー
- クリック: 3回
- この商品を含むブログ (2件) を見る
今日から読み始めた。Neuro-Dynamic Programming(ニューロ動的計画法)とはSuttonさんのFAQによると強化学習の別名だそうだ。1996年にこの著者らによってニューラルネットと動的計画法を組み合わせて作られたためこう呼ばれた。動的計画法は強化学習の基礎。それに関数近似としてニューラルネットを組み合わせたものが Neuro-Dynamic Programming。
実はこの本、図書館になくて購入を依頼したのは自分だ。強化学習のバイブルだと書いたら購入してくれた。しかし去年は全く理解できず、ほとんど読まなかった。せっかく購入してもらったのに読まないというのはあまりにももったいない。今回は読破したい。とは言え、この間、検索したら貸し出し中だった。誰か強化学習に興味ある人がいたのかな。