人工知能に関する断創録

人工知能、認知科学、心理学、ロボティクス、生物学などに興味を持っています。このブログでは人工知能のさまざまな分野について調査したことをまとめています。最近は、機械学習、Deep Learning、Kerasに関する記事が多いです。



アドバイスあり強化学習

このアルゴリズムの位置づけは下の図のようになっていると思われる。

f:id:aidiary:20050806153203j:plain

アドバイスあり強化学習のアドバイスはニューラルネットの正解に相当すると思う。ニューラルネットは常に正解を必要とする。一方、アドバイスあり強化学習はニューラルネットに比べてわずかな正解を与えるだけですみ、残りは強化学習の試行錯誤でやってくれる。コンピュータがもっと強力になれば余計な段階だけど今の時点では必要と思われる。