人工知能に関する断創録

このブログでは人工知能のさまざまな分野について調査したことをまとめています(更新停止: 2019年12月31日)

ブログのテキストマイニング

Excelで学ぶテキストマイニング入門

Excelで学ぶテキストマイニング入門

この本を参考にしてこのブログを対象にテキストマイニングの手法を適用してみた。

  • キーワード頻度
  • 単語間の共起分析
  • 記事の自動分類

などをしてみたいと考えている。とりあえず、ブログ全体をxmlファイルにエクスポート(はてなの機能)して余計なタグをとっぱらって茶筅を使って形態素解析してみた。人工知能なんかは人工と知能に分割されてしまうし、ニューラルネットなどの専門用語は未知語扱いされてしまうな。