人間同士の自然なコミュニケーションを支援する知能メディア技術
人間同士の自然なコミュニケーションを支援する知能メディア技術という報告会へネタ集めのため聴きに行った。黒橋さんの「会話情報学のための言語情報処理」という発表が一番興味持った。
Webの超大規模情報から格フレームを自動的に構築するという研究だ。格フレームは常識を構築する元だと言われている。これをWebから抽出しようというのは面白い。
Webから5億文をスパイダーで取得して構文解析とクラスタリングをする。PC1台だと8年かかるくらいの量だが400台のグリッドを使って8日間で処理しているらしい。うーむ。こういう人間がどうやっても処理できないような超大規模データからの学習は結構面白そう。わくわく感がある。
いずれ同じような方法使って人工無脳(chatbot)に応用してみたいな。ここに資料がアップされてる。面白いネタは後で整理してからまとめる予定。
東大へ初めて行った。さすが歴史を感じさせる建物が多いなー。