AIBOと強化学習
C Magazine にロボットを制御するという特集があった。読んで見るとAIBOの動作を制御するOPEN-R SDKに関するものだった。その中に、AIBOの設計者のインタビューで、「AIBOは飼い主に慣れるのはどんな風にやっているんですか」みたいな質問があった。設計者によると強化学習を使っているとのことだった。頭をなでると正の報酬だろうか。詳細は企業秘密かな。
C Magazine にロボットを制御するという特集があった。読んで見るとAIBOの動作を制御するOPEN-R SDKに関するものだった。その中に、AIBOの設計者のインタビューで、「AIBOは飼い主に慣れるのはどんな風にやっているんですか」みたいな質問があった。設計者によると強化学習を使っているとのことだった。頭をなでると正の報酬だろうか。詳細は企業秘密かな。