2010-12-01から1ヶ月間の記事一覧
2010年目標(2010/1/1)のつづき。 人工知能に関する三テーマ(2009/3/23)の深耕 テキスト分類の基礎から初めてLSI (Latent Semantic Indexing)、pLSI(probabilistic LSI)、LDA(Latent Dirichlet Allocation)と進めていってシソーラスや連想ネットワー…
WindowsでMeCab Pythonを使う(2010/11/21)のつづきです。形態素解析を使ってると単語が変なところで切れていたり、未知語が多かったりと不満点が出てきます。また、応用によっては、形態素ではなく、複合語単位で抽出したいということもしばしばあります。…