人工知能に関する断創録

このブログでは人工知能のさまざまな分野について調査したことをまとめています(更新停止: 2019年12月31日)

RoboCupへの強化学習の応用

RoboCupというのは、ロボットにサッカーをやらせるやつ。

浅田さんの論文に、RoboCupへ強化学習をどう応用するかが載っていた。

浅田、野田、俵積田、細田: 視覚に基づく強化学習によるロボットの行動獲得、日本ロボット学会誌、Vol.13、No.1、1995

今まで迷路のようなグリッドワールドばかりだったから、状態はグリッドのます目だと思い込んでいたが、状態ってもっといろいろに定義できることを知った(というか忘れていた)。

このRoboCupに応用できるなら、Robocode にも応用できるんじゃないかと思い始めてきた。上の論文を参考に状態空間と行動空間を適切に設定して、予め、シミュレーションを何度も行って最適政策を獲得したロボットを使えば結構強いかも。たぶん、もうやられているだろうけれど。ちょっとやってみると、いい練習になるし、結構面白いかも。