ブログのテキストマイニング
- 作者: 林俊克
- 出版社/メーカー: オーム社
- 発売日: 2002/10
- メディア: 単行本
- 購入: 3人 クリック: 42回
- この商品を含むブログ (11件) を見る
この本を参考にしてこのブログを対象にテキストマイニングの手法を適用してみた。
- キーワード頻度
- 単語間の共起分析
- 記事の自動分類
などをしてみたいと考えている。とりあえず、ブログ全体をxmlファイルにエクスポート(はてなの機能)して余計なタグをとっぱらって茶筅を使って形態素解析してみた。人工知能なんかは人工と知能に分割されてしまうし、ニューラルネットなどの専門用語は未知語扱いされてしまうな。