内部評価系の自己組織的形成
報酬の自律生成(2003/2/18)の続き。強化学習においてエージェント内部で報酬を自律生成させたい。手がかりがなかったのだが、それらしいのを見つけた。
望月: 強化学習エージェントにおける多様な内部評価系の自己組織的形成, 1999
神戸大学の修士論文のようだ。読んでみたい。
報酬の自律生成(2003/2/18)の続き。強化学習においてエージェント内部で報酬を自律生成させたい。手がかりがなかったのだが、それらしいのを見つけた。
望月: 強化学習エージェントにおける多様な内部評価系の自己組織的形成, 1999
神戸大学の修士論文のようだ。読んでみたい。