人工知能に関する断創録

人工知能、認知科学、心理学、ロボティクス、生物学などに興味を持っています。このブログでは人工知能のさまざまな分野について調査したことをまとめています。最近は、機械学習、Deep Learning、Kerasに関する記事が多いです。



SarsaとQ-learning

を実装して、「風が吹く格子世界問題(p.156)」に適用してみた。SarsaとQ-learningはどっちも強化学習の手法、両者はたった1箇所だけアルゴリズムに違いがある。しかし、この問題に対しては、ほとんど差がでなかった。下の本によると、「崖歩き問題(p.160)」でアルゴリズム差がでるらしい(実際に出た!Q-learningだと、崖のぎりぎりの近道を通る。Sarsaは崖から離れた遠回りだけど安全な道を通る。この差がどうして起きるかもアルゴリズムとにらめっこしてなんとかわかった。ページ数は「強化学習」という本のもの。

強化学習

強化学習