人工知能に関する断創録

このブログでは人工知能のさまざまな分野について調査したことをまとめています(更新停止: 2019年12月31日)

2002-11-01から1ヶ月間の記事一覧

報酬と感情

強化学習と報酬(2002/11/20)で、 報酬は環境から与えられるというのも何だかあまりぴんとこない。気持ちいいとかうれしいとかいう(報酬にあたりそうなもの)のは人(エージェント)の内部から起きているんじゃないか?外部から与えられても人によって感じ…

不可能と笑われた時は、実は研究がうまく進んでいるときだ

読売新聞2002年11月28日号に「ノーベル賞受賞者を囲む」というパネルディスカッションの概要が載っていた。プルシナーさんという人が言及した上の言葉が印象的だった。また、このディスカッションの記事で久しぶりに人工知能という言葉を見つけた。他に同氏…

AIという言葉

人工知能の未来は―AIはいま、どこまで人間らしくなったか作者: ジョージジョンソン,渕一博出版社/メーカー: 日本実業出版社発売日: 1988/07メディア: 単行本この商品を含むブログ (1件) を見るから少し長いけど引用。『ゲーデル、エッシャー、バッハ』の著者…

迷路問題アプレット

を書いた。今度は迷路をもっと大きくしてみた。やってることは前と同じ。迷路が大きいので学習が収束するまで見ていると日が暮れる。そこで、アニメーションを表示しないで学習だけ行えるようにした。収束した後、アニメーションで見てみると最短経路を獲得…

強化学習は教師あり学習?

脳と学習システムの関係として、小脳は誤差信号をもとにした教師あり学習に、大脳基底核は報酬信号をもとにした強化学習に、大脳皮質は、信号の統計的性質をもとにした教師無し学習に対応するらしい。これはどういうことを言っているのかまだわからないため…

脳と強化学習

強化学習のサーベイを行っているが、人間の脳との関係というのを見逃していた。そこで、脳と強化学習をキーワードで調べてみたところ、いくつか参考になるのが見つかった。医学の歩みに「強化学習とその周辺」という特集が組まれている。どうやら大脳基底核…

NNとGAとRL

ニューラルネット(NN)と遺伝的アルゴリズム(GA)と強化学習(RL)は何か関係があるのだろうか。全部同じようなことができる、全部ロボット学習に使われている。どれがどんな場合に優れているとかあるのだろうか。ニューラルネットは教師あり学習だと思っ…

ブライテンベルクビークル

知の創成でブライテンベルクビークルという面白いロボットが紹介されていた。ブライテンベルクは脳研究者で簡単なロボット(車輪とセンサしかないようなもの)を考えて思考実験を行った。その結論は、 きわめて単純な脳であっても、外部の観察者からは非常に…

音源定位

AIチャレンジ研究会(SIG-Challenge-0216)を聴講しに行った。テーマは「ロボット聴覚・ロボット対話やCASA(音環境理解、聴覚による情景分析)」。音声認識の細かい話はほとんど知らないのであまり分からなかった。ただ、特許庁の人もいっていたが、AIBOが…

強化学習と報酬

考えたことのメモ。強化学習の特徴の一つに報酬に基づいているというのがある。でも報酬って一体何なんだろうか。現実世界に当てはめた場合は何に相当するのか。例えば、AIBO(本当の犬でもそうだが)が「おりこうな」行動をして頭をなでられたら報酬であり…

Humanoid Robots

について発表した。話は変わるが、昨日「伊藤家の食卓」というTV番組を見てたら、左手の薬指を右手で握って、右手で強く握る、緩めるというのを1分ほど繰り返すと、心拍数が低下してどきどきがなくなり、あがらなくなるというのがやっていた。左手の薬指には…

ime.nu

最近、やけにアクセス数が多いと思っていた。カウンタ見ていても一日に100くらい増えている。何か変だと思って、アクセスログを見てみたらほとんどが http://ime.nu という変なURLからだった。少し調べてみたところ2ちゃんねるがリンク先であることがわかっ…

不完全知覚問題

今週は不完全知覚についてやった。不完全知覚問題とは、エージェントの知覚が不十分であるため、異なる状態を同じ状態と判断してしまう問題である。例を挙げる。このような単純な迷路の環境を考える。Sはスタート地点、Gはゴール地点。従来の強化学習では全…

強化学習の実ロボットへの適用例

強化学習の実ロボットへの適用例 非常に面白い映像だった。学習初期ではでたらめなのが、学習後では目的動作を果たしている。人間をはじめとする動物にもあのような徐々に動作を獲得する仕組みが備わっていそうと実感した。あのロボットは何か生きているよう…

ロボットの技術動向―特許情報から見た開発動向と今後の方向性―

という特許庁の岩谷一臣さんの講演を聴いた。ロボットとは、産業用ロボット、ヒューマノイドロボット、エンターテインメントロボットなどが含まれている。その技術動向をまとめると、 日本は、産業用ロボットの出荷台数、特許数ともに世界一であるが、欧米は…

HTML

に関する本を買った。HTML & XHTML 第5版作者: Chuck Musciano,Bill Kennedy,原隆文出版社/メーカー: オライリー・ジャパン発売日: 2003/05/26メディア: 単行本購入: 1人 クリック: 79回この商品を含むブログ (14件) を見る今さらという気もしないではないが…

アクセスログ解析

とかしてみた。特にGoogleとかで外部からどんな経路で来ている人がいるか気になったので調べてみた。というか、Googleでこのページがヒットするのかも怪しかったんだけど。調べてみて非常に驚いたのだが、適当にキーワードを入力すると検索結果の2ページ以内…

理工展

の公開授業を聴きに行った。白井先生の「言語科学と人工知能」という話。あまり目新しい話はなかったけど、WABOT-2(ラウンジに飾ってあるオルガンを弾くロボット)のデモビデオが見られたのは良かった。初めて動いているところを見た。会話もして、結構いい…

車の山登り問題アプレット

一日でできた。アルゴリズム部はJavaに直して、描画部分を付け加えた。青い丸が一応車で山の右側に抜ける方法を獲得する。車は右へ到達すると初期位置に戻る。何回か繰り返すと短時間で登れるようになっていく。mountain_car.jar初めてタイルコーディングを…

車の山登り問題(Mountain-Car Task)

次の強化学習の例題として上のを調べてみることにした。これには、タイルコーディング(tile coding)という手法が使われている(非常に重要)。Suttonさんの本読んでもいまいち理解できなかったので、プログラムを調べてみることにした。またアプレットにで…

卒論計画

今月は、卒論で必要な外国の重要論文を読むことにした(それをしないと孫引きになってしまう)。ひとまず、リストを作って探すことからはじめないといけない。今日から3日間で「関数近似」に関する論文を調べることにする。後は、3日から5日くらいで区切って…