メトロポリス

SF

メトロポリス [DVD]出版社/メーカー: バンダイビジュアル発売日: 2001/12/07メディア: DVD購入: 1人クリック: 26回この商品を含むブログ (53件) を見る今日は、休憩した。手塚治虫さんが原作の「メトロポリス」っていう映画見た（1949年に書かれた原作も読…

2002-12-07

はっきり言い切る姿勢

日記

論文の書き方的な本で家にあった理科系の作文技術 (中公新書 (624))作者: 木下是雄出版社/メーカー: 中央公論新社発売日: 1981/01メディア: 新書購入: 107人クリック: 1,559回この商品を含むブログ (334件) を見るをざっと読んだ。これは有名な本「らしい」…

2002-12-05

TD-Gammon

強化学習ゲームAI

TD-GammonはIBMのTesauroさんが作ったプログラムである。強化学習の TD(λ) というアルゴリズムを用いて、バックギャモンというゲームの戦略を「自動的に」獲得する。このTD-Gammonによって強化学習が注目されるようになったという経緯がある。今までバックギ…

2002-12-04

動物の心

認知科学

動物に心はあるのか？自己認識はあるのか？そして知能はあるのか？というのは興味深い問題である。これらは動物行動学などの分野で研究されている。心をもつ機械―人工知能の誕生と進化作者: スタン・フランクリン,林一出版社/メーカー: 三田出版会発売日: 19…

2002-12-03

迷路問題 with 不完全知覚

強化学習

前に不完全知覚問題（2002/11/14）について言及した。9X9の迷路問題でエージェントの知覚を周囲8マスに制限して試してみたところ全く収束しなかった。前に書いた通り同じところを行ったり来たりしてしまう。ランダムな探査を5%の確率でしているため運良くゴ…

2002-12-02

大脳基底核と強化学習

強化学習脳科学

の関係について調べたのでざっとまとめておく。大脳基底核は昔から行動に関係しているということは分かっていたが、詳しい機能は分かっていなかったらしい（実際、1980年あたりの脳の本を読んでも謎と書いてあった）。しかし、最近の研究でドーパミンを報酬…

2002-11-28

報酬と感情

強化学習

強化学習と報酬（2002/11/20）で、報酬は環境から与えられるというのも何だかあまりぴんとこない。気持ちいいとかうれしいとかいう（報酬にあたりそうなもの）のは人（エージェント）の内部から起きているんじゃないか？外部から与えられても人によって感じ…

2002-11-28

不可能と笑われた時は、実は研究がうまく進んでいるときだ

日記

読売新聞2002年11月28日号に「ノーベル賞受賞者を囲む」というパネルディスカッションの概要が載っていた。プルシナーさんという人が言及した上の言葉が印象的だった。また、このディスカッションの記事で久しぶりに人工知能という言葉を見つけた。他に同氏…

2002-11-28

AIという言葉

認知科学

人工知能の未来は―AIはいま、どこまで人間らしくなったか作者: ジョージジョンソン,渕一博出版社/メーカー: 日本実業出版社発売日: 1988/07メディア: 単行本この商品を含むブログ (1件) を見るから少し長いけど引用。『ゲーデル、エッシャー、バッハ』の著者…

2002-11-27

迷路問題アプレット

強化学習

を書いた。今度は迷路をもっと大きくしてみた。やってることは前と同じ。迷路が大きいので学習が収束するまで見ていると日が暮れる。そこで、アニメーションを表示しないで学習だけ行えるようにした。収束した後、アニメーションで見てみると最短経路を獲得…

2002-11-26

強化学習は教師あり学習？

強化学習

脳と学習システムの関係として、小脳は誤差信号をもとにした教師あり学習に、大脳基底核は報酬信号をもとにした強化学習に、大脳皮質は、信号の統計的性質をもとにした教師無し学習に対応するらしい。これはどういうことを言っているのかまだわからないため…

2002-11-26

脳と強化学習

脳科学強化学習

強化学習のサーベイを行っているが、人間の脳との関係というのを見逃していた。そこで、脳と強化学習をキーワードで調べてみたところ、いくつか参考になるのが見つかった。医学の歩みに「強化学習とその周辺」という特集が組まれている。どうやら大脳基底核…

2002-11-24

NNとGAとRL

機械学習

ニューラルネット（NN）と遺伝的アルゴリズム（GA）と強化学習（RL）は何か関係があるのだろうか。全部同じようなことができる、全部ロボット学習に使われている。どれがどんな場合に優れているとかあるのだろうか。ニューラルネットは教師あり学習だと思っ…

2002-11-23

ブライテンベルクビークル

認知科学

知の創成でブライテンベルクビークルという面白いロボットが紹介されていた。ブライテンベルクは脳研究者で簡単なロボット（車輪とセンサしかないようなもの）を考えて思考実験を行った。その結論は、きわめて単純な脳であっても、外部の観察者からは非常に…

2002-11-22

音源定位

ロボティクス音声認識

AIチャレンジ研究会（SIG-Challenge-0216）を聴講しに行った。テーマは「ロボット聴覚・ロボット対話やCASA（音環境理解、聴覚による情景分析）」。音声認識の細かい話はほとんど知らないのであまり分からなかった。ただ、特許庁の人もいっていたが、AIBOが…

2002-11-20

強化学習と報酬

認知科学強化学習

考えたことのメモ。強化学習の特徴の一つに報酬に基づいているというのがある。でも報酬って一体何なんだろうか。現実世界に当てはめた場合は何に相当するのか。例えば、AIBO（本当の犬でもそうだが）が「おりこうな」行動をして頭をなでられたら報酬であり…

2002-11-20

Humanoid Robots

ロボティクス

について発表した。話は変わるが、昨日「伊藤家の食卓」というTV番組を見てたら、左手の薬指を右手で握って、右手で強く握る、緩めるというのを1分ほど繰り返すと、心拍数が低下してどきどきがなくなり、あがらなくなるというのがやっていた。左手の薬指には…

2002-11-18

ime.nu

日記

最近、やけにアクセス数が多いと思っていた。カウンタ見ていても一日に100くらい増えている。何か変だと思って、アクセスログを見てみたらほとんどが http://ime.nu という変なURLからだった。少し調べてみたところ2ちゃんねるがリンク先であることがわかっ…

2002-11-14

不完全知覚問題

強化学習

今週は不完全知覚についてやった。不完全知覚問題とは、エージェントの知覚が不十分であるため、異なる状態を同じ状態と判断してしまう問題である。例を挙げる。このような単純な迷路の環境を考える。Sはスタート地点、Gはゴール地点。従来の強化学習では全…

2002-11-11

強化学習の実ロボットへの適用例

強化学習ロボティクス

強化学習の実ロボットへの適用例非常に面白い映像だった。学習初期ではでたらめなのが、学習後では目的動作を果たしている。人間をはじめとする動物にもあのような徐々に動作を獲得する仕組みが備わっていそうと実感した。あのロボットは何か生きているよう…

2002-11-09

ロボットの技術動向―特許情報から見た開発動向と今後の方向性―

ロボティクス

という特許庁の岩谷一臣さんの講演を聴いた。ロボットとは、産業用ロボット、ヒューマノイドロボット、エンターテインメントロボットなどが含まれている。その技術動向をまとめると、日本は、産業用ロボットの出荷台数、特許数ともに世界一であるが、欧米は…

2002-11-09

HTML

日記

に関する本を買った。HTML & XHTML 第5版作者: Chuck Musciano,Bill Kennedy,原隆文出版社/メーカー: オライリー・ジャパン発売日: 2003/05/26メディア: 単行本購入: 1人クリック: 79回この商品を含むブログ (14件) を見る今さらという気もしないではないが…