人工知能に関する断創録

このブログでは人工知能のさまざまな分野について調査したことをまとめています(更新停止: 2019年12月31日)

2004-01-01から1ヶ月間の記事一覧

強化学習におけるヒューリスティクス

強化学習は結局最適解の探索問題にすぎないように思われる(こういうとつまんない感じがするけど)。各状態でどの行動を取ればよいか探索して見つけるのが強化学習の目的だから。「探索」というと人工知能の基礎分野の1つだが、前にそこ勉強してたときヒュー…

アイデアのつくり方

アイデアについての2つの原理(2002/7/1)ってのを書いた。これの元ネタがわかった。アイデアのつくり方作者: ジェームス W.ヤング,竹内均,今井茂雄出版社/メーカー: 阪急コミュニケーションズ発売日: 1988/04/08メディア: 単行本購入: 91人 クリック: 1,126…

研究発表会

だった。並列化による強化学習の高速化というテーマで発表した。今、強化学習をテーマにしてるけど何でだっけかな。過去の研究履歴見ると機械学習関連の本(2002/8/1)にいきなり「強化学習」って言葉が出てくる。数ある学習アルゴリズムの中で強化学習を選…

R.A.Brooks氏が早稲田に!

「RTは安心を創造するか」というシンポジウムが早稲田で2月7日に開かれる。なんと、あのR. A. Brooks氏の講演があるではないか!絶対、行きだ。

ヴァレンティーナ―コンピュータ・ネットワークの女王

SF

ってSFを読んだ。ヴァレンティーナ―コンピュータ・ネットワークの女王 (新潮文庫)作者: J.ディレーニイ,M.スティーグラー,小川隆出版社/メーカー: 新潮社発売日: 1986/07メディア: 文庫 クリック: 52回この商品を含むブログ (6件) を見るヴァレンティーナは…

報酬をエージェントの学習過程で与えるのが難しい理由

強化学習における人とエージェントの相互作用(2004/1/14)の続き。Isbellの論文を元にまとめておく。 適切な状態空間の選択 これは、Cobotの例に限らず強化学習一般に言えると思う。適切に状態を設定しないと学習が収束しないこともある。 複数の報酬源と矛…

強化学習における人とエージェントの相互作用

強化学習における人間とエージェントのコミュニケーション(2003/12/31)の続き。人とエージェントの相互作用(HAI:Human Agent Interaction)を取り入れた強化学習に関する研究を調べた。相互作用といってもいろいろある。多いのは、エージェントの学習過程…

適応インタフェース 機械学習とヒューマンインタフェースの接点

ヒューマンインタフェース(Human Interface : HI)関係のレポート書くので題材探してた。最近のHI研究は、ポストGUIとして、拡張現実、ユビキタス、ウェアラブルみたいな実世界指向が流行ってることがつかめた。つまり、画面の中の情報世界から実世界を対象…

今年やりたいこと

とにかく修論。 認知科学。特に心理学とかの上位層部分。 ヒューマンインターフェース。興味わいてきた。 データベースとUML。使い方あんまり知らないから。 就活。 今年はすごく大変そう。12月31日はたしてどうなっているか。