2002-01-01から1年間の記事一覧
メトロポリス [DVD]出版社/メーカー: バンダイビジュアル発売日: 2001/12/07メディア: DVD購入: 1人 クリック: 26回この商品を含むブログ (53件) を見る今日は、休憩した。手塚治虫さんが原作の「メトロポリス」っていう映画見た(1949年に書かれた原作も読…
論文の書き方的な本で家にあった理科系の作文技術 (中公新書 (624))作者: 木下是雄出版社/メーカー: 中央公論新社発売日: 1981/01メディア: 新書購入: 107人 クリック: 1,559回この商品を含むブログ (334件) を見るをざっと読んだ。これは有名な本「らしい」…
TD-GammonはIBMのTesauroさんが作ったプログラムである。強化学習の TD(λ) というアルゴリズムを用いて、バックギャモンというゲームの戦略を「自動的に」獲得する。このTD-Gammonによって強化学習が注目されるようになったという経緯がある。今までバックギ…
動物に心はあるのか?自己認識はあるのか?そして知能はあるのか?というのは興味深い問題である。これらは動物行動学などの分野で研究されている。心をもつ機械―人工知能の誕生と進化作者: スタン・フランクリン,林一出版社/メーカー: 三田出版会発売日: 19…
前に不完全知覚問題(2002/11/14)について言及した。9X9の迷路問題でエージェントの知覚を周囲8マスに制限して試してみたところ全く収束しなかった。前に書いた通り同じところを行ったり来たりしてしまう。ランダムな探査を5%の確率でしているため運良くゴ…
の関係について調べたのでざっとまとめておく。大脳基底核は昔から行動に関係しているということは分かっていたが、詳しい機能は分かっていなかったらしい(実際、1980年あたりの脳の本を読んでも謎と書いてあった)。しかし、最近の研究でドーパミンを報酬…
強化学習と報酬(2002/11/20)で、 報酬は環境から与えられるというのも何だかあまりぴんとこない。気持ちいいとかうれしいとかいう(報酬にあたりそうなもの)のは人(エージェント)の内部から起きているんじゃないか?外部から与えられても人によって感じ…
読売新聞2002年11月28日号に「ノーベル賞受賞者を囲む」というパネルディスカッションの概要が載っていた。プルシナーさんという人が言及した上の言葉が印象的だった。また、このディスカッションの記事で久しぶりに人工知能という言葉を見つけた。他に同氏…
人工知能の未来は―AIはいま、どこまで人間らしくなったか作者: ジョージジョンソン,渕一博出版社/メーカー: 日本実業出版社発売日: 1988/07メディア: 単行本この商品を含むブログ (1件) を見るから少し長いけど引用。『ゲーデル、エッシャー、バッハ』の著者…
を書いた。今度は迷路をもっと大きくしてみた。やってることは前と同じ。迷路が大きいので学習が収束するまで見ていると日が暮れる。そこで、アニメーションを表示しないで学習だけ行えるようにした。収束した後、アニメーションで見てみると最短経路を獲得…
脳と学習システムの関係として、小脳は誤差信号をもとにした教師あり学習に、大脳基底核は報酬信号をもとにした強化学習に、大脳皮質は、信号の統計的性質をもとにした教師無し学習に対応するらしい。これはどういうことを言っているのかまだわからないため…
強化学習のサーベイを行っているが、人間の脳との関係というのを見逃していた。そこで、脳と強化学習をキーワードで調べてみたところ、いくつか参考になるのが見つかった。医学の歩みに「強化学習とその周辺」という特集が組まれている。どうやら大脳基底核…
ニューラルネット(NN)と遺伝的アルゴリズム(GA)と強化学習(RL)は何か関係があるのだろうか。全部同じようなことができる、全部ロボット学習に使われている。どれがどんな場合に優れているとかあるのだろうか。ニューラルネットは教師あり学習だと思っ…
知の創成でブライテンベルクビークルという面白いロボットが紹介されていた。ブライテンベルクは脳研究者で簡単なロボット(車輪とセンサしかないようなもの)を考えて思考実験を行った。その結論は、 きわめて単純な脳であっても、外部の観察者からは非常に…
AIチャレンジ研究会(SIG-Challenge-0216)を聴講しに行った。テーマは「ロボット聴覚・ロボット対話やCASA(音環境理解、聴覚による情景分析)」。音声認識の細かい話はほとんど知らないのであまり分からなかった。ただ、特許庁の人もいっていたが、AIBOが…
考えたことのメモ。強化学習の特徴の一つに報酬に基づいているというのがある。でも報酬って一体何なんだろうか。現実世界に当てはめた場合は何に相当するのか。例えば、AIBO(本当の犬でもそうだが)が「おりこうな」行動をして頭をなでられたら報酬であり…
について発表した。話は変わるが、昨日「伊藤家の食卓」というTV番組を見てたら、左手の薬指を右手で握って、右手で強く握る、緩めるというのを1分ほど繰り返すと、心拍数が低下してどきどきがなくなり、あがらなくなるというのがやっていた。左手の薬指には…
最近、やけにアクセス数が多いと思っていた。カウンタ見ていても一日に100くらい増えている。何か変だと思って、アクセスログを見てみたらほとんどが http://ime.nu という変なURLからだった。少し調べてみたところ2ちゃんねるがリンク先であることがわかっ…
今週は不完全知覚についてやった。不完全知覚問題とは、エージェントの知覚が不十分であるため、異なる状態を同じ状態と判断してしまう問題である。例を挙げる。このような単純な迷路の環境を考える。Sはスタート地点、Gはゴール地点。従来の強化学習では全…
強化学習の実ロボットへの適用例 非常に面白い映像だった。学習初期ではでたらめなのが、学習後では目的動作を果たしている。人間をはじめとする動物にもあのような徐々に動作を獲得する仕組みが備わっていそうと実感した。あのロボットは何か生きているよう…
という特許庁の岩谷一臣さんの講演を聴いた。ロボットとは、産業用ロボット、ヒューマノイドロボット、エンターテインメントロボットなどが含まれている。その技術動向をまとめると、 日本は、産業用ロボットの出荷台数、特許数ともに世界一であるが、欧米は…
に関する本を買った。HTML & XHTML 第5版作者: Chuck Musciano,Bill Kennedy,原隆文出版社/メーカー: オライリー・ジャパン発売日: 2003/05/26メディア: 単行本購入: 1人 クリック: 79回この商品を含むブログ (14件) を見る今さらという気もしないではないが…
とかしてみた。特にGoogleとかで外部からどんな経路で来ている人がいるか気になったので調べてみた。というか、Googleでこのページがヒットするのかも怪しかったんだけど。調べてみて非常に驚いたのだが、適当にキーワードを入力すると検索結果の2ページ以内…
の公開授業を聴きに行った。白井先生の「言語科学と人工知能」という話。あまり目新しい話はなかったけど、WABOT-2(ラウンジに飾ってあるオルガンを弾くロボット)のデモビデオが見られたのは良かった。初めて動いているところを見た。会話もして、結構いい…
一日でできた。アルゴリズム部はJavaに直して、描画部分を付け加えた。青い丸が一応車で山の右側に抜ける方法を獲得する。車は右へ到達すると初期位置に戻る。何回か繰り返すと短時間で登れるようになっていく。mountain_car.jar初めてタイルコーディングを…
次の強化学習の例題として上のを調べてみることにした。これには、タイルコーディング(tile coding)という手法が使われている(非常に重要)。Suttonさんの本読んでもいまいち理解できなかったので、プログラムを調べてみることにした。またアプレットにで…
今月は、卒論で必要な外国の重要論文を読むことにした(それをしないと孫引きになってしまう)。ひとまず、リストを作って探すことからはじめないといけない。今日から3日間で「関数近似」に関する論文を調べることにする。後は、3日から5日くらいで区切って…
マッチ箱の脳(AI)―使える人工知能のお話作者: 森川幸人出版社/メーカー: 新紀元社発売日: 2000/12メディア: 単行本購入: 3人 クリック: 60回この商品を含むブログ (35件) を見るのWeb版があった。マッチ箱の脳まだ全部読んでいないけど、最後のAI対談#2が面…
は一体何なのか。全部聞いたことはあるが、違いがよく分からなかったので調べてみた。ロボットとサイボーグはきちんと定義された科学用語。一方、ヒューマノイドとアンドロイドはSF用語である。ロボットという言葉は、カレル・チャペック(1890-1938)の造っ…
を書いた。pole_balancing.jar棒を上に立てたままうまくバランスを保つ方法を自動的に獲得できる。最終的には、100000ステップ(シミュレーション内の時間では、1ステップ0.02秒なので、30分くらい)バランスを保てるようになる。もっと学習時間を長くすれば…