人工知能に関する断創録

このブログでは人工知能のさまざまな分野について調査したことをまとめています(更新停止: 2019年12月31日)

2016年の目標

あけましておめでとうございます。

今年もいくつか目標を立てた。メインは去年と同じく深層学習(Deep Learning)の深耕にした。

機械学習・深層学習の深耕

情報理論 (ちくま学芸文庫)

情報理論 (ちくま学芸文庫)

Information Theory, Inference and Learning Algorithms

Information Theory, Inference and Learning Algorithms

スパース性に基づく機械学習 (機械学習プロフェッショナルシリーズ)

スパース性に基づく機械学習 (機械学習プロフェッショナルシリーズ)

その他

  • Python3への移行
  • MOT・イノベーション・マーケティング関係の本を月1冊以上読む
  • 英語ライティングを鍛える

入門 Python 3

入門 Python 3

  • 作者: Bill Lubanovic,斎藤康毅,長尾高弘
  • 出版社/メーカー: オライリージャパン
  • 発売日: 2015/12/01
  • メディア: 単行本(ソフトカバー)
  • この商品を含むブログを見る
イノベーションの最終解 (ハーバード・ビジネス・セレクション)

イノベーションの最終解 (ハーバード・ビジネス・セレクション)

  • 作者: クレイトン・M・クリステンセン,スコット・D・アンソニー,エリック・A・ロス,玉田俊平太,櫻井祐子
  • 出版社/メーカー: 翔泳社
  • 発売日: 2014/07/08
  • メディア: 単行本
  • この商品を含むブログ (6件) を見る
The Elements of Style, Fourth Edition

The Elements of Style, Fourth Edition

今年は技術だけではなく、ビジネス寄りの話(技術をどう役立てるか?お金にするか?)も少し勉強してみたいと考えている。実践で身につけるのが一般的なのだろうけれど・・・とりあえず評価の高い本を片っ端から読んでみることから始めたい。

また今年はカンファレンス、講演会、展示会、勉強会などもう少し積極的に参加して見聞を広めてみようと思っている。昔はよく参加していたのだけれど最近はとんと出不精になっていた。

そんなわけで今年もブログは続けようと思いますのでよろしくお願いいたします。

2015年まとめ

2015年目標(2015/1/11)のつづき。今年ももう終わりということで目標に対する振り返り。今年は4つ目標を立てていた。

(1) Deep Learningの勉強

Deep Learningの勉強・研究は今年から本格的に始めた。主にDeep Learning Tutorialを読み、Theanoで実装しながら基本的なアルゴリズムを理解することに集中した。ロジスティック回帰、多層パーセプトロン、畳み込みニューラルネットワーク、自己符号化器、制約ボルツマンマシン、Deep Belief Networkあたりまで教科書に載っているような手法はだいたい理解できた。話題のTensorFlowは来年かな?

あとはこの二冊を熟読した。基礎は一通り抑えたのでこれで最新の論文も読めるようになるかな?

深層学習 (機械学習プロフェッショナルシリーズ)

深層学習 (機械学習プロフェッショナルシリーズ)

深層学習: Deep Learning

深層学習: Deep Learning

  • 作者: 麻生英樹,安田宗樹,前田新一,岡野原大輔,岡谷貴之,久保陽太郎,ボレガラダヌシカ,人工知能学会,神嶌敏弘
  • 出版社/メーカー: 近代科学社
  • 発売日: 2015/11/05
  • メディア: 単行本
  • この商品を含むブログ (1件) を見る

(2) Pythonによるモンテカルロ法入門

Pythonによるモンテカルロ法の実装はやらなかった。ただ、制約ボルツマンマシンの理解にMCMCが必要になりアルゴリズムは抑えたので△。

(3) pandasとscikit-learnの習得と活用

Pythonのデータ分析ライブラリpandasと機械学習ライブラリscikit-learnは使えるようになった。scikit-learnに関してはSciPy2015のチュートリアルを参考に4つ記事を書いた。

(4) 複雑系の勉強 ×

複雑系の勉強は残念ながらやらなかった。Deep Learningの方で手一杯だった。

(5) その他

統計的声質変換

Pythonで音声信号処理(2011/5/14)の応用の一環として統計的声質変換の実験をした。音声の扱い方がわかってきた。

ベイズ推定とグラフィカルモデル:コンピュータビジョン基礎

機械学習とコンピュータビジョンの勉強のためにC­omputer vision: models, learning and inferenceを読み始めた。テキストは無料で手に入る。あと玉木先生がYoutubeで講義を配信している。PRMLよりわかりやすい。これもまだ途中なので来年も続けたい。

Synapses, Neurons and Brains

人工知能学会誌の脳神経系シミュレーションの特集をよりよく理解するためCourseraで Synapses, Neurons and Brains という神経科学の講義を受講した。ニューロンの発火の仕組みから脳シミュレーションまで。Idan Segev教授の説明が非常に熱心だったのが印象に残った。でも試験はすごく細かくてものすごーくイライラした(笑)この講義内容に関してはTwitterでときおりつぶやいただけでブログには全くまとめていなかった。Twitterはあとから見直しにくいから少し問題だな。

読んだ or 読んでいる本

今年(じゃないのもあるけど)は人工知能に関する本が豊作だったのでいくつか読んだ。

人工知能は人間を超えるか (角川EPUB選書)

人工知能は人間を超えるか (角川EPUB選書)

AIの衝撃 人工知能は人類の敵か (講談社現代新書)

AIの衝撃 人工知能は人類の敵か (講談社現代新書)

人工知能 人類最悪にして最後の発明

人工知能 人類最悪にして最後の発明

AIは「心」を持てるのか 脳に近いアーキテクチャ

AIは「心」を持てるのか 脳に近いアーキテクチャ

The Quest for Artificial Intelligence

The Quest for Artificial Intelligence

フューチャー・オブ・マインド 心の未来を科学する

フューチャー・オブ・マインド 心の未来を科学する

〈わたし〉はどこにあるのか: ガザニガ脳科学講義

〈わたし〉はどこにあるのか: ガザニガ脳科学講義

意識をめぐる冒険

意識をめぐる冒険

今年はKindle Paperwhiteを買ったこともあって電子書籍を頻繁に買うようになったのが大きな変化かな。著作権が切れて大安売りしている吉川英治の歴史小説(三国志、新水滸伝、新平家物語、私本太平記、新書太閤記、宮本武蔵)に無茶苦茶はまっていた。

最後に

Fallout4最高!

Fallout4

Fallout4

人工知能によるコンテンツ生成と著作権

今朝の読売新聞に面白い記事があったのでご紹介。

AI芸術著作権は?

人工知能(AI)が自動的に作った楽曲や小説は「誰の作品」になるのか。政府は「AIアート」が将来、本格的に普及するとみて、 年明けから著作権のあり方について議論を始める。 そもそも著作権を認めるべきなのか、「これはこのAIの作品だ」ということをどう証明するのかなど、 整備すべきルールは多岐にわたる。

読売新聞 2015年12月30日

この記事では人工知能芸術の事例として

の2つが取り上げられている。このような人工知能システムで作ったコンテンツの著作権はどうなるのか?というお話だった。著作権は作者の死後50年間とされているが、人工知能は死なないので保護期間が問題になるそうだ。システム(サービス)停止から50年でいいのでは?と直感的に思ったけれど、システムを公開しないでゴーストライターみたいな使い方をするケースの方が多そうなのでやはり難しい問題か・・・ちなみに現状の法体系では、著作物を「思想または感情を創作的に表現したもの」と定義しているため思想や感情を持たない人工知能が生成したものが著作物として認められる可能性は低いとのことらしい。

生成したコンテンツの著作権以前に人工知能システムを学習するのに用いた著作物の扱いがどうなっているのかが気になる。現状のコンテンツ生成手法は、既存のコンテンツ(テキスト、画像、音楽)から何らかの"特徴"を学習して、学習したモデルから新しいコンテンツを生成するタイプが多いと推測している。人間も既存コンテンツを参考に新しいものを創造することが多いけれど、人工知能が既存コンテンツを"参考にする"ことはどこまで許されるのだろうか?

法律に関してはほとんど無知なのでちょっと調べてみたが、著作権法の47条に情報解析目的なら著作物を自由に使ってよいとあった。

(情報解析のための複製等) 第四十七条の七 著作物は、電子計算機による情報解析(多数の著作物その他の大量の情報から、当該情報を構成する言語、音、影像その他の要素に係る情報を抽出し、比較、分類その他の統計的な解析を行うことをいう。以下この条において同じ。)を行うことを目的とする場合には、必要と認められる限度において、記録媒体への記録又は翻案(これにより創作した二次的著作物の記録を含む。)を行うことができる。ただし、情報解析を行う者の用に供するために作成されたデータベースの著作物については、この限りでない。

じゃあWebから集めたテキスト・画像・動画・音声・音楽を人工知能に与える訓練データとして使う場合は「情報解析」に当たるとみなしてOKってことだろうか?そこから新しいコンテンツを生成して自分が作ったと発表してもOKなのだろうか? 具体例がなく「その他の統計的な解析」、「必要と認められる限度」のような曖昧な表現があってどこまでOKなのかこれではわからない・・・ここら辺の議論はもう決着しているのかな?

先の記事で取り上げられたシステム以外にも人工知能によるコンテンツ生成に関する技術は近年盛んに研究されていて個人的にすごく興味を持っている。流行りのDeep Learningが多いけれど、Darwin Tunesのように遺伝的アルゴリズムが使われる例もある。来年はここら辺の技術をメインにとりあげていきたい。