強化学習におけるヒューリスティクス

強化学習

強化学習は結局最適解の探索問題にすぎないように思われる（こういうとつまんない感じがするけど）。各状態でどの行動を取ればよいか探索して見つけるのが強化学習の目的だから。「探索」というと人工知能の基礎分野の1つだが、前にそこ勉強してたときヒュー…

アイデアのつくり方

日記

アイデアについての2つの原理（2002/7/1）ってのを書いた。これの元ネタがわかった。アイデアのつくり方作者: ジェームス W.ヤング,竹内均,今井茂雄出版社/メーカー: 阪急コミュニケーションズ発売日: 1988/04/08メディア: 単行本購入: 91人クリック: 1,126…

強化学習

だった。並列化による強化学習の高速化というテーマで発表した。今、強化学習をテーマにしてるけど何でだっけかな。過去の研究履歴見ると機械学習関連の本（2002/8/1）にいきなり「強化学習」って言葉が出てくる。数ある学習アルゴリズムの中で強化学習を選…

ロボティクス

「RTは安心を創造するか」というシンポジウムが早稲田で2月7日に開かれる。なんと、あのR. A. Brooks氏の講演があるではないか！絶対、行きだ。

SF

ってSFを読んだ。ヴァレンティーナ―コンピュータ・ネットワークの女王 (新潮文庫)作者: J.ディレーニイ,M.スティーグラー,小川隆出版社/メーカー: 新潮社発売日: 1986/07メディア: 文庫クリック: 52回この商品を含むブログ (6件) を見るヴァレンティーナは…

強化学習

強化学習における人とエージェントの相互作用（2004/1/14）の続き。Isbellの論文を元にまとめておく。適切な状態空間の選択これは、Cobotの例に限らず強化学習一般に言えると思う。適切に状態を設定しないと学習が収束しないこともある。複数の報酬源と矛…

強化学習

強化学習における人間とエージェントのコミュニケーション（2003/12/31）の続き。人とエージェントの相互作用（HAI:Human Agent Interaction）を取り入れた強化学習に関する研究を調べた。相互作用といってもいろいろある。多いのは、エージェントの学習過程…

機械学習

ヒューマンインタフェース（Human Interface : HI）関係のレポート書くので題材探してた。最近のHI研究は、ポストGUIとして、拡張現実、ユビキタス、ウェアラブルみたいな実世界指向が流行ってることがつかめた。つまり、画面の中の情報世界から実世界を対象…

日記

とにかく修論。認知科学。特に心理学とかの上位層部分。ヒューマンインターフェース。興味わいてきた。データベースとUML。使い方あんまり知らないから。就活。今年はすごく大変そう。12月31日はたしてどうなっているか。