RoboCupへの強化学習の応用
RoboCupというのは、ロボットにサッカーをやらせるやつ。
浅田さんの論文に、RoboCupへ強化学習をどう応用するかが載っていた。
浅田、野田、俵積田、細田: 視覚に基づく強化学習によるロボットの行動獲得、日本ロボット学会誌、Vol.13、No.1、1995
今まで迷路のようなグリッドワールドばかりだったから、状態はグリッドのます目だと思い込んでいたが、状態ってもっといろいろに定義できることを知った(というか忘れていた)。
このRoboCupに応用できるなら、Robocode にも応用できるんじゃないかと思い始めてきた。上の論文を参考に状態空間と行動空間を適切に設定して、予め、シミュレーションを何度も行って最適政策を獲得したロボットを使えば結構強いかも。たぶん、もうやられているだろうけれど。ちょっとやってみると、いい練習になるし、結構面白いかも。