広大な情報の海へ
Spidering hacks―ウェブ情報ラクラク取得テクニック101選
- 作者: Kevin Hemenway,Tara Calishain,村上雅章
- 出版社/メーカー: オライリー・ジャパン
- 発売日: 2004/05
- メディア: 単行本
- 購入: 52人 クリック: 904回
- この商品を含むブログ (103件) を見る
スパイダー(別名クローラー、ロボット)の作り方が書いてある本。ぜひ勉強しておきたい分野だったがようやくいい本にめぐり合えた。
スパイダーは情報検索の分野で非常に重要なプログラムだ。あのGoogleもあちこちのサイトの情報を集めるためにネット上に多数のスパイダーを放っている。ウェブ(蜘蛛の巣)の上をうごめくプログラムだからスパイダー(蜘蛛)って言うみたいね。洒落てる、最初に名づけた人は頭いい!
情報検索の分野では、ネット上の情報をかき集めてきてハードディスクに保存するためにスパイダーを使っている。その溜め込んだデータにインデックスをつけて高速な検索を可能にしている(Googleで検索すると0.1秒で結果が返ってくるの昔すごく不思議だったなぁ)。
ただ私がスパイダーの作り方を知りたかったのはもっと不純(?)な動機だ。端的に言うとヴァレンティーナ(2004/1/21)やネットワークを渡り鳥するプログラム(2002/5/26)を創りたいから。インターネットは広大な情報の宝庫(ゴミ箱?)だけどそこから学習して進歩するようなプログラムにあこがれる。もう少しきちんとした知識ベースを作る計画はある(Cycなど)けれどやっぱウェブが使えるといいなぁ。
上のSFみたいにそっから意識がある人工知能ができるとかそんなとこまでは考えていない。膨大な情報の海を泳ぐエージェントを使って何か面白いものをいずれ作ってみたいな。関連技術としてテキストマイニング、Webコンテンツマイニング、モバイルエージェントなどが考えられるけど順に調べていきたい。
hackシリーズは面白い。他にも
Google Hacks―プロが使うテクニック&ツール100選
- 作者: タラ・カリシェイン,ラエル・ドーンフェスト,山名早人,田中裕子
- 出版社/メーカー: オライリー・ジャパン
- 発売日: 2003/08/20
- メディア: 単行本(ソフトカバー)
- クリック: 11回
- この商品を含むブログ (49件) を見る
Amazon Hacks 世界最大のショッピングサイト完全活用テクニック100選
- 作者: ポール・ボシュ,篠原稔和,ウェブ・ユーザビリティ研究会
- 出版社/メーカー: オライリー・ジャパン
- 発売日: 2004/04/24
- メディア: 単行本
- 購入: 3人 クリック: 39回
- この商品を含むブログ (43件) を見る
Blog Hacks ―プロが教えるテクニック&ツール100選
- 作者: 宮川達彦,伊藤直也
- 出版社/メーカー: オライリー・ジャパン
- 発売日: 2004/08/07
- メディア: 単行本
- 購入: 6人 クリック: 348回
- この商品を含むブログ (114件) を見る
はぜひ読んでおきたいな。