報酬と感情

強化学習

強化学習と報酬（2002/11/20）で、報酬は環境から与えられるというのも何だかあまりぴんとこない。気持ちいいとかうれしいとかいう（報酬にあたりそうなもの）のは人（エージェント）の内部から起きているんじゃないか？外部から与えられても人によって感じ…

2002-11-28

不可能と笑われた時は、実は研究がうまく進んでいるときだ

日記

読売新聞2002年11月28日号に「ノーベル賞受賞者を囲む」というパネルディスカッションの概要が載っていた。プルシナーさんという人が言及した上の言葉が印象的だった。また、このディスカッションの記事で久しぶりに人工知能という言葉を見つけた。他に同氏…

2002-11-28

AIという言葉

認知科学

人工知能の未来は―AIはいま、どこまで人間らしくなったか作者: ジョージジョンソン,渕一博出版社/メーカー: 日本実業出版社発売日: 1988/07メディア: 単行本この商品を含むブログ (1件) を見るから少し長いけど引用。『ゲーデル、エッシャー、バッハ』の著者…

2002-11-27

迷路問題アプレット

強化学習

を書いた。今度は迷路をもっと大きくしてみた。やってることは前と同じ。迷路が大きいので学習が収束するまで見ていると日が暮れる。そこで、アニメーションを表示しないで学習だけ行えるようにした。収束した後、アニメーションで見てみると最短経路を獲得…

2002-11-26

強化学習は教師あり学習？

強化学習

脳と学習システムの関係として、小脳は誤差信号をもとにした教師あり学習に、大脳基底核は報酬信号をもとにした強化学習に、大脳皮質は、信号の統計的性質をもとにした教師無し学習に対応するらしい。これはどういうことを言っているのかまだわからないため…

2002-11-26

脳と強化学習

脳科学強化学習

強化学習のサーベイを行っているが、人間の脳との関係というのを見逃していた。そこで、脳と強化学習をキーワードで調べてみたところ、いくつか参考になるのが見つかった。医学の歩みに「強化学習とその周辺」という特集が組まれている。どうやら大脳基底核…

2002-11-24

NNとGAとRL

機械学習

ニューラルネット（NN）と遺伝的アルゴリズム（GA）と強化学習（RL）は何か関係があるのだろうか。全部同じようなことができる、全部ロボット学習に使われている。どれがどんな場合に優れているとかあるのだろうか。ニューラルネットは教師あり学習だと思っ…

2002-11-23

ブライテンベルクビークル

認知科学

知の創成でブライテンベルクビークルという面白いロボットが紹介されていた。ブライテンベルクは脳研究者で簡単なロボット（車輪とセンサしかないようなもの）を考えて思考実験を行った。その結論は、きわめて単純な脳であっても、外部の観察者からは非常に…

2002-11-22

音源定位

ロボティクス音声認識

AIチャレンジ研究会（SIG-Challenge-0216）を聴講しに行った。テーマは「ロボット聴覚・ロボット対話やCASA（音環境理解、聴覚による情景分析）」。音声認識の細かい話はほとんど知らないのであまり分からなかった。ただ、特許庁の人もいっていたが、AIBOが…

2002-11-20

強化学習と報酬

認知科学強化学習

考えたことのメモ。強化学習の特徴の一つに報酬に基づいているというのがある。でも報酬って一体何なんだろうか。現実世界に当てはめた場合は何に相当するのか。例えば、AIBO（本当の犬でもそうだが）が「おりこうな」行動をして頭をなでられたら報酬であり…

2002-11-20

Humanoid Robots

ロボティクス

について発表した。話は変わるが、昨日「伊藤家の食卓」というTV番組を見てたら、左手の薬指を右手で握って、右手で強く握る、緩めるというのを1分ほど繰り返すと、心拍数が低下してどきどきがなくなり、あがらなくなるというのがやっていた。左手の薬指には…

2002-11-18

ime.nu

日記

最近、やけにアクセス数が多いと思っていた。カウンタ見ていても一日に100くらい増えている。何か変だと思って、アクセスログを見てみたらほとんどが http://ime.nu という変なURLからだった。少し調べてみたところ2ちゃんねるがリンク先であることがわかっ…

2002-11-14

不完全知覚問題

強化学習

今週は不完全知覚についてやった。不完全知覚問題とは、エージェントの知覚が不十分であるため、異なる状態を同じ状態と判断してしまう問題である。例を挙げる。このような単純な迷路の環境を考える。Sはスタート地点、Gはゴール地点。従来の強化学習では全…

2002-11-11

強化学習の実ロボットへの適用例

強化学習ロボティクス

強化学習の実ロボットへの適用例非常に面白い映像だった。学習初期ではでたらめなのが、学習後では目的動作を果たしている。人間をはじめとする動物にもあのような徐々に動作を獲得する仕組みが備わっていそうと実感した。あのロボットは何か生きているよう…

2002-11-09

ロボットの技術動向―特許情報から見た開発動向と今後の方向性―

ロボティクス

という特許庁の岩谷一臣さんの講演を聴いた。ロボットとは、産業用ロボット、ヒューマノイドロボット、エンターテインメントロボットなどが含まれている。その技術動向をまとめると、日本は、産業用ロボットの出荷台数、特許数ともに世界一であるが、欧米は…

2002-11-09

HTML

日記

に関する本を買った。HTML & XHTML 第5版作者: Chuck Musciano,Bill Kennedy,原隆文出版社/メーカー: オライリー・ジャパン発売日: 2003/05/26メディア: 単行本購入: 1人クリック: 79回この商品を含むブログ (14件) を見る今さらという気もしないではないが…