人工知能に関する断創録

このブログでは人工知能のさまざまな分野について調査したことをまとめています(更新停止: 2019年12月31日)

アドバイスあり強化学習

このアルゴリズムの位置づけは下の図のようになっていると思われる。

f:id:aidiary:20050806153203j:plain

アドバイスあり強化学習のアドバイスはニューラルネットの正解に相当すると思う。ニューラルネットは常に正解を必要とする。一方、アドバイスあり強化学習はニューラルネットに比べてわずかな正解を与えるだけですみ、残りは強化学習の試行錯誤でやってくれる。コンピュータがもっと強力になれば余計な段階だけど今の時点では必要と思われる。