2016年の目標
あけましておめでとうございます。
今年もいくつか目標を立てた。メインは去年と同じく深層学習(Deep Learning)の深耕にした。
機械学習・深層学習の深耕
- Deep Learning Tutorialの読破とTheanoでの実装を続ける
- パターン生成・コンテンツ生成(2015/12/30)に関する従来研究のサーベイ
- 深層強化学習(Deep Reinforcement Learning)の理解
- 1週間に1本は論文を熟読する
- TensorFlowをさわってみる
- Computer vision: models, learning and inference(2015/12/31)の読破
- 情報理論の勉強
- 多様体学習(manifold learning)の勉強
- Sparse Codingの勉強
- 上記に関係する数学の習得
- 作者: 甘利俊一
- 出版社/メーカー: 筑摩書房
- 発売日: 2011/04/08
- メディア: 単行本
- 購入: 4人 クリック: 48回
- この商品を含むブログ (11件) を見る
Information Theory, Inference and Learning Algorithms
- 作者: David J. C. MacKay
- 出版社/メーカー: Cambridge University Press
- 発売日: 2003/09
- メディア: ペーパーバック
- クリック: 4回
- この商品を含むブログ (5件) を見る
スパース性に基づく機械学習 (機械学習プロフェッショナルシリーズ)
- 作者: 冨岡亮太
- 出版社/メーカー: 講談社
- 発売日: 2015/12/19
- メディア: 単行本(ソフトカバー)
- この商品を含むブログを見る
その他
- Python3への移行
- MOT・イノベーション・マーケティング関係の本を月1冊以上読む
- 英語ライティングを鍛える
- 作者: Bill Lubanovic,斎藤康毅,長尾高弘
- 出版社/メーカー: オライリージャパン
- 発売日: 2015/12/01
- メディア: 単行本(ソフトカバー)
- この商品を含むブログを見る
イノベーションの最終解 (ハーバード・ビジネス・セレクション)
- 作者: クレイトン・M・クリステンセン,スコット・D・アンソニー,エリック・A・ロス,玉田俊平太,櫻井祐子
- 出版社/メーカー: 翔泳社
- 発売日: 2014/07/08
- メディア: 単行本
- この商品を含むブログ (6件) を見る
The Elements of Style, Fourth Edition
- 作者: William Strunk Jr.,E. B. White
- 出版社/メーカー: Longman
- 発売日: 1999/07/23
- メディア: ペーパーバック
- 購入: 49人 クリック: 171回
- この商品を含むブログ (49件) を見る
今年は技術だけではなく、ビジネス寄りの話(技術をどう役立てるか?お金にするか?)も少し勉強してみたいと考えている。実践で身につけるのが一般的なのだろうけれど・・・とりあえず評価の高い本を片っ端から読んでみることから始めたい。
また今年はカンファレンス、講演会、展示会、勉強会などもう少し積極的に参加して見聞を広めてみようと思っている。昔はよく参加していたのだけれど最近はとんと出不精になっていた。
そんなわけで今年もブログは続けようと思いますのでよろしくお願いいたします。
2015年まとめ
2015年目標(2015/1/11)のつづき。今年ももう終わりということで目標に対する振り返り。今年は4つ目標を立てていた。
(1) Deep Learningの勉強 ◎
Deep Learningの勉強・研究は今年から本格的に始めた。主にDeep Learning Tutorialを読み、Theanoで実装しながら基本的なアルゴリズムを理解することに集中した。ロジスティック回帰、多層パーセプトロン、畳み込みニューラルネットワーク、自己符号化器、制約ボルツマンマシン、Deep Belief Networkあたりまで教科書に載っているような手法はだいたい理解できた。話題のTensorFlowは来年かな?
あとはこの二冊を熟読した。基礎は一通り抑えたのでこれで最新の論文も読めるようになるかな?
- 作者: 岡谷貴之
- 出版社/メーカー: 講談社
- 発売日: 2015/04/08
- メディア: 単行本(ソフトカバー)
- この商品を含むブログ (7件) を見る
- 作者: 麻生英樹,安田宗樹,前田新一,岡野原大輔,岡谷貴之,久保陽太郎,ボレガラダヌシカ,人工知能学会,神嶌敏弘
- 出版社/メーカー: 近代科学社
- 発売日: 2015/11/05
- メディア: 単行本
- この商品を含むブログ (1件) を見る
(2) Pythonによるモンテカルロ法入門 △
Pythonによるモンテカルロ法の実装はやらなかった。ただ、制約ボルツマンマシンの理解にMCMCが必要になりアルゴリズムは抑えたので△。
(3) pandasとscikit-learnの習得と活用 ○
Pythonのデータ分析ライブラリpandasと機械学習ライブラリscikit-learnは使えるようになった。scikit-learnに関してはSciPy2015のチュートリアルを参考に4つ記事を書いた。
(4) 複雑系の勉強 ×
複雑系の勉強は残念ながらやらなかった。Deep Learningの方で手一杯だった。
(5) その他
統計的声質変換
Pythonで音声信号処理(2011/5/14)の応用の一環として統計的声質変換の実験をした。音声の扱い方がわかってきた。
ベイズ推定とグラフィカルモデル:コンピュータビジョン基礎
機械学習とコンピュータビジョンの勉強のためにComputer vision: models, learning and inferenceを読み始めた。テキストは無料で手に入る。あと玉木先生がYoutubeで講義を配信している。PRMLよりわかりやすい。これもまだ途中なので来年も続けたい。
Synapses, Neurons and Brains
人工知能学会誌の脳神経系シミュレーションの特集をよりよく理解するためCourseraで Synapses, Neurons and Brains という神経科学の講義を受講した。ニューロンの発火の仕組みから脳シミュレーションまで。Idan Segev教授の説明が非常に熱心だったのが印象に残った。でも試験はすごく細かくてものすごーくイライラした(笑)この講義内容に関してはTwitterでときおりつぶやいただけでブログには全くまとめていなかった。Twitterはあとから見直しにくいから少し問題だな。
読んだ or 読んでいる本
今年(じゃないのもあるけど)は人工知能に関する本が豊作だったのでいくつか読んだ。
- 作者: 松尾豊
- 出版社/メーカー: KADOKAWA / 中経出版
- 発売日: 2015/03/10
- メディア: Kindle版
- この商品を含むブログ (24件) を見る
- 作者: 小林雅一
- 出版社/メーカー: 講談社
- 発売日: 2015/03/20
- メディア: Kindle版
- この商品を含むブログ (10件) を見る
- 作者: ジェイムズ・バラット
- 出版社/メーカー: ダイヤモンド社
- 発売日: 2015/06/22
- メディア: Kindle版
- この商品を含むブログ (2件) を見る
- 作者: ジョージザルカダキス
- 出版社/メーカー: 日経BP社
- 発売日: 2015/09/16
- メディア: Kindle版
- この商品を含むブログを見る
The Quest for Artificial Intelligence
- 作者: Nils J. Nilsson
- 出版社/メーカー: Cambridge University Press
- 発売日: 2009/10/30
- メディア: Kindle版
- この商品を含むブログを見る
- 作者: ミチオ・カク
- 出版社/メーカー: NHK出版
- 発売日: 2015/02/27
- メディア: Kindle版
- この商品を含むブログ (1件) を見る
- 作者: マイケル・S.ガザニガ,Michael S. Gazzaniga,藤井留美
- 出版社/メーカー: 紀伊國屋書店
- 発売日: 2014/08/28
- メディア: 単行本
- この商品を含むブログ (9件) を見る
- 作者: クリストフ・コッホ,土谷尚嗣,小畑史哉
- 出版社/メーカー: 岩波書店
- 発売日: 2014/08/07
- メディア: 単行本
- この商品を含むブログ (8件) を見る
今年はKindle Paperwhiteを買ったこともあって電子書籍を頻繁に買うようになったのが大きな変化かな。著作権が切れて大安売りしている吉川英治の歴史小説(三国志、新水滸伝、新平家物語、私本太平記、新書太閤記、宮本武蔵)に無茶苦茶はまっていた。
最後に
- 出版社/メーカー: ベセスダ・ソフトワークス
- 発売日: 2015/12/17
- メディア: DVD-ROM
- この商品を含むブログ (3件) を見る
人工知能によるコンテンツ生成と著作権
今朝の読売新聞に面白い記事があったのでご紹介。
AI芸術著作権は?
人工知能(AI)が自動的に作った楽曲や小説は「誰の作品」になるのか。政府は「AIアート」が将来、本格的に普及するとみて、 年明けから著作権のあり方について議論を始める。 そもそも著作権を認めるべきなのか、「これはこのAIの作品だ」ということをどう証明するのかなど、 整備すべきルールは多岐にわたる。
読売新聞 2015年12月30日
この記事では人工知能芸術の事例として
- 短編小説生成システム「きまぐれ人工知能プロジェクト 作家ですのよ」
- 自動作曲システム「Orpheus」
の2つが取り上げられている。このような人工知能システムで作ったコンテンツの著作権はどうなるのか?というお話だった。著作権は作者の死後50年間とされているが、人工知能は死なないので保護期間が問題になるそうだ。システム(サービス)停止から50年でいいのでは?と直感的に思ったけれど、システムを公開しないでゴーストライターみたいな使い方をするケースの方が多そうなのでやはり難しい問題か・・・ちなみに現状の法体系では、著作物を「思想または感情を創作的に表現したもの」と定義しているため思想や感情を持たない人工知能が生成したものが著作物として認められる可能性は低いとのことらしい。
生成したコンテンツの著作権以前に人工知能システムを学習するのに用いた著作物の扱いがどうなっているのかが気になる。現状のコンテンツ生成手法は、既存のコンテンツ(テキスト、画像、音楽)から何らかの"特徴"を学習して、学習したモデルから新しいコンテンツを生成するタイプが多いと推測している。人間も既存コンテンツを参考に新しいものを創造することが多いけれど、人工知能が既存コンテンツを"参考にする"ことはどこまで許されるのだろうか?
法律に関してはほとんど無知なのでちょっと調べてみたが、著作権法の47条に情報解析目的なら著作物を自由に使ってよいとあった。
(情報解析のための複製等) 第四十七条の七 著作物は、電子計算機による情報解析(多数の著作物その他の大量の情報から、当該情報を構成する言語、音、影像その他の要素に係る情報を抽出し、比較、分類その他の統計的な解析を行うことをいう。以下この条において同じ。)を行うことを目的とする場合には、必要と認められる限度において、記録媒体への記録又は翻案(これにより創作した二次的著作物の記録を含む。)を行うことができる。ただし、情報解析を行う者の用に供するために作成されたデータベースの著作物については、この限りでない。
じゃあWebから集めたテキスト・画像・動画・音声・音楽を人工知能に与える訓練データとして使う場合は「情報解析」に当たるとみなしてOKってことだろうか?そこから新しいコンテンツを生成して自分が作ったと発表してもOKなのだろうか? 具体例がなく「その他の統計的な解析」、「必要と認められる限度」のような曖昧な表現があってどこまでOKなのかこれではわからない・・・ここら辺の議論はもう決着しているのかな?
先の記事で取り上げられたシステム以外にも人工知能によるコンテンツ生成に関する技術は近年盛んに研究されていて個人的にすごく興味を持っている。流行りのDeep Learningが多いけれど、Darwin Tunesのように遺伝的アルゴリズムが使われる例もある。来年はここら辺の技術をメインにとりあげていきたい。
- キャプションの自動生成 - 画像からテキストを生成
- 画像の自動生成 - Deep Convolutional Generative Adversarial Networks (DCGAN)
- イラストの自動生成 (1) - DCGAN
- イラストの自動生成 (2) - DCGAN
- 画風の変換 - A Neural Algorithm of Artistic Stlye
- 画風変換の解説 - Chainer-Gogh
- 楽曲の自動生成 - Recurrent Neural Networks
- 自動作曲サービス - Jukedeck、人工知能らしいが詳細な仕組みは不明
- メロディ進化 - Darwin Tunes、遺伝的アルゴリズム