人工知能に関する断創録

人工知能、認知科学、心理学、ロボティクス、生物学などに興味を持っています。このブログでは人工知能のさまざまな分野について調査したことをまとめています。最近は、機械学習、Deep Learning、Kerasに関する記事が多いです。



関数近似

今までやってきた強化学習は状態数が離散でそんなに多くない場合だったけど、ロボットや実問題で使うときは、状態が連続、あるいは膨大になってしまい、状態を配列 V(s) や Q(s, a) で管理することはできなくなる。

状態が連続値や膨大になっても強化学習を使えるようにするために、関数近似という手法がある。この部分は本(強化学習)を読んでも図がないためよく分からなかった(数式で書かれてもイメージがわかなかった)のだが、連続な空間における強化学習 のページがとても分かりやすく、直感的な理解ができた。