読者です 読者をやめる 読者になる 読者になる

人工知能に関する断創録

人工知能、認知科学、心理学、ロボティクス、生物学などに興味を持っています。このブログでは人工知能のさまざまな分野について調査したことをまとめています。最近は、機械学習、Deep Learning、Kerasに関する記事が多いです。



Neuro-Dynamic Programming

Neuro-Dynamic Programming (Optimization and Neural Computation Series, 3)

Neuro-Dynamic Programming (Optimization and Neural Computation Series, 3)

今日から読み始めた。Neuro-Dynamic Programming(ニューロ動的計画法)とはSuttonさんのFAQによると強化学習の別名だそうだ。1996年にこの著者らによってニューラルネットと動的計画法を組み合わせて作られたためこう呼ばれた。動的計画法は強化学習の基礎。それに関数近似としてニューラルネットを組み合わせたものが Neuro-Dynamic Programming。

実はこの本、図書館になくて購入を依頼したのは自分だ。強化学習のバイブルだと書いたら購入してくれた。しかし去年は全く理解できず、ほとんど読まなかった。せっかく購入してもらったのに読まないというのはあまりにももったいない。今回は読破したい。とは言え、この間、検索したら貸し出し中だった。誰か強化学習に興味ある人がいたのかな。