人工知能に関する断創録

このブログでは人工知能のさまざまな分野について調査したことをまとめています(更新停止: 2019年12月31日)

2003-08-01から1ヶ月間の記事一覧

PCクラスタ上での強化学習 Qテーブルの結合

共有メモリ型の方もまだ問題があるが、分散メモリ型の方を少し考えた。クラスタ上で並列に強化学習を行う場合に最も問題となるのは、別々に学習したQテーブルをうまく結合できるかという点だと思う。というわけで実験してみた。結果が次のグラフ。PC1とPC2で…

ワクチンウィルス

MSブラスト(ラブサン)っていうウィルス(ワーム)が流行っているみたいだけど、それを退治してパソコンを修復してまわるMSブラストDっていうウィルス(ワーム)があるらしい。ワクチンウィルスとでも呼ぶべきか。前にワーム(2002/2/28)に「自動的にウィ…

報酬の例2

Skinnerは、特定のクラスの条件性強化子に対して「般性強化子」という用語を使った。おそらく般性強化子の最もよい例はお金であろう。この強化子が、社会で働いている人の行動を維持していることは明白である。もし雇用者が、もう一切給料を払わないと言えば…

報酬の例

強化学習においての報酬とは現実の何にあたるのかという問題は少し気になる。例えば、強化学習と報酬(2002/11/20)とか報酬の自律生成(2003/2/18)で少し考えていた。強化学習を最適化アルゴリズムの一種と考えればそんなことどうでもよい問題(報酬はタス…

メイザーの学習と行動

メイザーの学習と行動作者: ジェームズ・E.メイザー,磯博行,坂上貴之,川合伸幸出版社/メーカー: 二瓶社発売日: 1999/09メディア: 単行本 クリック: 13回この商品を含むブログ (8件) を見るを読む。著者はジェームズ・E.メイザー。動物の学習心理学に関する本…

共有メモリ型並列計算機上での強化学習 学習時間が変だ・・・

共有メモリ型並列計算機上での強化学習 複数CPU(2003/8/1)の続き。前の結果を見ると、1スレッドと2スレッドの間は10倍遅くなっているが3スレッドにすると速くなっている。何か怪しかったけどさらにスレッドを増やして測定してみた。学習曲線は学習収束まで…

共有メモリ型並列計算機上での強化学習 複数CPU

共有メモリ型並列計算機上での強化学習(2003/7/23)の続き。同期を取っていたせいで実行速度が遅いと思っていたので、同期を全く取らないように修正し、収束するまでの時間を測定した。結果、1スレッド 6秒、2スレッド 約50秒、3スレッド 約24秒・・・何な…