人工知能に関する断創録

このブログでは人工知能のさまざまな分野について調査したことをまとめています(更新停止: 2019年12月31日)

Neuro-Dynamic Programming

Neuro-Dynamic Programming (Optimization and Neural Computation Series, 3)

Neuro-Dynamic Programming (Optimization and Neural Computation Series, 3)

今日から読み始めた。Neuro-Dynamic Programming(ニューロ動的計画法)とはSuttonさんのFAQによると強化学習の別名だそうだ。1996年にこの著者らによってニューラルネットと動的計画法を組み合わせて作られたためこう呼ばれた。動的計画法は強化学習の基礎。それに関数近似としてニューラルネットを組み合わせたものが Neuro-Dynamic Programming。

実はこの本、図書館になくて購入を依頼したのは自分だ。強化学習のバイブルだと書いたら購入してくれた。しかし去年は全く理解できず、ほとんど読まなかった。せっかく購入してもらったのに読まないというのはあまりにももったいない。今回は読破したい。とは言え、この間、検索したら貸し出し中だった。誰か強化学習に興味ある人がいたのかな。