インテリジェンス・ダイナミクス2006
インテリジェンス・ダイナミクス2006(2006/02/20)の続き。
聴講してきた。久しぶりに興奮するアイデアに出会った。『多様な経験から生み出されるインテリジェンス・モデル』って講演とQRIOを使ったデモ。
何がすごいかって言うとまったく異なる複数のタスクを1つの共通の基盤で学習できたこと。これは感動した!
まずボール転がし、ベル叩き、迷路遊び、ミニカー遊び、ボール打ち返し、風船キャッチ、風船パンチ、ままごと遊び、木馬、ブロック崩しなどのタスクをQRIOに学習させる。やり方は初期誘導学習(2005/09/21)のようにQRIOを人間が遠隔操作して教示する方法のようだ。
何がすごいかっていうとこれら10以上のタスクをRNN-SOM*1という単一の記憶システムに学習させているところ。タスクごとに学習器を用意していないのだ。
各タスクを学習させるとSOM上にダイナミックにタスクの経験が記憶される。そして、ある状況が与えられるとマップ上の該当部分が発火して学習した動作が再生されていた。たとえば、目の前に赤い風船が与えられるとチョップが再生され、ミニカーをおくとミニカー遊びが再生され、ブロックを置くと壊そうとする・・・面白い。論文とか出てたらぜひ読んでみたいな。
その他の講演も期待通り楽しいものでした。ただ茂木さんの話は事前に著書を一通り読んでいたのであんまり目新しいアイデアはなかった。本の方ですでにいっぱいあったけど。成果は書籍にまとまっていくそうです。
関連リンク
- 作者: 土井利忠,藤田雅博,下村秀樹
- 出版社/メーカー: シュプリンガー・フェアラーク東京
- 発売日: 2005/12/20
- メディア: 単行本
- 購入: 2人 クリック: 18回
- この商品を含むブログ (13件) を見る
*1:RNNはリカレントニューラルネットワーク、SOMは自己組織化マップの略。14×14ノードのSOMなのだが各ノードがそれぞれリカレントニューラルネットワークという複雑なもの