人工知能に関する断創録

このブログでは人工知能のさまざまな分野について調査したことをまとめています(更新停止: 2019年12月31日)

2004-01-01から1年間の記事一覧

情報処理学会全国大会

に行ってみた。情報処理学会は学部4年生のとき会員だったけどもう脱会してしまった(人工知能学会は今でも入っているけど)。非会員でも(学生なら)無料で入れるなんて太っ腹だ。論文がダウンロードできないのはけちくさいけど。2つ聴いた。1つ目はATR 萩田…

Pongアプレット

Pongっていうボールを跳ね返すゲームを強化学習するアプレットを書いた。pong_learning.jarこれやっている途中に強化学習の問題点をが浮上してきた。その問題点とは、何を状態、行動、報酬にすべきかを決めるのが難しいこと。この問題は強化学習に限らず、他…

あしたのロボット

SF

っていう瀬名秀明さんの小説を読んだ。あしたのロボット作者: 瀬名秀明出版社/メーカー: 文藝春秋発売日: 2002/10メディア: 単行本購入: 1人 クリック: 5回この商品を含むブログ (31件) を見るロボット入門(2003/2/22)でロボット21世紀って本を読んだが、…

コンピュータの名著・古典100冊

コンピュータの名著・古典100冊作者: 石田晴久,青山幹雄,安達淳,塩田紳二,山田伸一郎出版社/メーカー: インプレス発売日: 2003/10/29メディア: 単行本購入: 4人 クリック: 41回この商品を含むブログ (42件) を見るって本見つけたので買ってみた。・・・なる…

倒立振子制御問題+人による教示

のアプレットを作ってみた。強化学習で人とエージェントの相互作用を入れると面白い予感。「教える」と「学ぶ」ってのは今回やったようなイメージが自然な気がする。そのうち、できなかったテトリスも教示を使ってうまくやらせてみたいな。pole_balance_teac…

人の経験とエージェントの経験の融合

強化学習は知識なし学習(そうじゃないという人もいるが)。学習過程で人の手助けは借りず、環境との相互作用のみから試行錯誤をとおして学習していく。しかし、その代償として学習速度を犠牲にしなければならない。学習が遅いことは大きな問題点としてあげ…

R.Pfeifer氏が早稲田に!

「神経の発生と可塑性 行動発現の基盤を探る」というシンポジウムが早稲田で開かれる。なんと、あの『知の創成』の著者 R. Pfeifer 氏や跳ね起きるロボット作った國吉氏の講演があるではないか!特に知の創成は、ブライテンビークル(2002/11/23)あたりに読…

RTは安心を創造するか

早稲田大学で開催された「RTは安心を創造するか」というシンポジウムに行って来た。最初の講演は、MIT人工知能研究所のR. A. Brooks氏。サブサンプションアーキテクチャーや身体性認知科学の提唱者で人工知能、ロボティクス研究では超有名人(だと思う)。ロ…

強化学習におけるヒューリスティクス

強化学習は結局最適解の探索問題にすぎないように思われる(こういうとつまんない感じがするけど)。各状態でどの行動を取ればよいか探索して見つけるのが強化学習の目的だから。「探索」というと人工知能の基礎分野の1つだが、前にそこ勉強してたときヒュー…

アイデアのつくり方

アイデアについての2つの原理(2002/7/1)ってのを書いた。これの元ネタがわかった。アイデアのつくり方作者: ジェームス W.ヤング,竹内均,今井茂雄出版社/メーカー: 阪急コミュニケーションズ発売日: 1988/04/08メディア: 単行本購入: 91人 クリック: 1,126…

研究発表会

だった。並列化による強化学習の高速化というテーマで発表した。今、強化学習をテーマにしてるけど何でだっけかな。過去の研究履歴見ると機械学習関連の本(2002/8/1)にいきなり「強化学習」って言葉が出てくる。数ある学習アルゴリズムの中で強化学習を選…

R.A.Brooks氏が早稲田に!

「RTは安心を創造するか」というシンポジウムが早稲田で2月7日に開かれる。なんと、あのR. A. Brooks氏の講演があるではないか!絶対、行きだ。

ヴァレンティーナ―コンピュータ・ネットワークの女王

SF

ってSFを読んだ。ヴァレンティーナ―コンピュータ・ネットワークの女王 (新潮文庫)作者: J.ディレーニイ,M.スティーグラー,小川隆出版社/メーカー: 新潮社発売日: 1986/07メディア: 文庫 クリック: 52回この商品を含むブログ (6件) を見るヴァレンティーナは…

報酬をエージェントの学習過程で与えるのが難しい理由

強化学習における人とエージェントの相互作用(2004/1/14)の続き。Isbellの論文を元にまとめておく。 適切な状態空間の選択 これは、Cobotの例に限らず強化学習一般に言えると思う。適切に状態を設定しないと学習が収束しないこともある。 複数の報酬源と矛…

強化学習における人とエージェントの相互作用

強化学習における人間とエージェントのコミュニケーション(2003/12/31)の続き。人とエージェントの相互作用(HAI:Human Agent Interaction)を取り入れた強化学習に関する研究を調べた。相互作用といってもいろいろある。多いのは、エージェントの学習過程…

適応インタフェース 機械学習とヒューマンインタフェースの接点

ヒューマンインタフェース(Human Interface : HI)関係のレポート書くので題材探してた。最近のHI研究は、ポストGUIとして、拡張現実、ユビキタス、ウェアラブルみたいな実世界指向が流行ってることがつかめた。つまり、画面の中の情報世界から実世界を対象…

今年やりたいこと

とにかく修論。 認知科学。特に心理学とかの上位層部分。 ヒューマンインターフェース。興味わいてきた。 データベースとUML。使い方あんまり知らないから。 就活。 今年はすごく大変そう。12月31日はたしてどうなっているか。