人工知能に関する断創録

このブログでは人工知能のさまざまな分野について調査したことをまとめています(更新停止: 2019年12月31日)

2010-12-01から1ヶ月間の記事一覧

2010年総括

2010年目標(2010/1/1)のつづき。 人工知能に関する三テーマ(2009/3/23)の深耕 テキスト分類の基礎から初めてLSI (Latent Semantic Indexing)、pLSI(probabilistic LSI)、LDA(Latent Dirichlet Allocation)と進めていってシソーラスや連想ネットワー…

テキストからWikipedia見出し語を抽出

WindowsでMeCab Pythonを使う(2010/11/21)のつづきです。形態素解析を使ってると単語が変なところで切れていたり、未知語が多かったりと不満点が出てきます。また、応用によっては、形態素ではなく、複合語単位で抽出したいということもしばしばあります。…