人工知能によるコンテンツ生成と著作権

今朝の読売新聞に面白い記事があったのでご紹介。

AI芸術著作権は？

人工知能（AI）が自動的に作った楽曲や小説は「誰の作品」になるのか。政府は「AIアート」が将来、本格的に普及するとみて、年明けから著作権のあり方について議論を始める。そもそも著作権を認めるべきなのか、「これはこのAIの作品だ」ということをどう証明するのかなど、整備すべきルールは多岐にわたる。

読売新聞 2015年12月30日

この記事では人工知能芸術の事例として

短編小説生成システム「きまぐれ人工知能プロジェクト作家ですのよ」
自動作曲システム「Orpheus」

の2つが取り上げられている。このような人工知能システムで作ったコンテンツの著作権はどうなるのか？というお話だった。著作権は作者の死後50年間とされているが、人工知能は死なないので保護期間が問題になるそうだ。システム（サービス）停止から50年でいいのでは？と直感的に思ったけれど、システムを公開しないでゴーストライターみたいな使い方をするケースの方が多そうなのでやはり難しい問題か・・・ちなみに現状の法体系では、著作物を「思想または感情を創作的に表現したもの」と定義しているため思想や感情を持たない人工知能が生成したものが著作物として認められる可能性は低いとのことらしい。

生成したコンテンツの著作権以前に人工知能システムを学習するのに用いた著作物の扱いがどうなっているのかが気になる。現状のコンテンツ生成手法は、既存のコンテンツ（テキスト、画像、音楽）から何らかの"特徴"を学習して、学習したモデルから新しいコンテンツを生成するタイプが多いと推測している。人間も既存コンテンツを参考に新しいものを創造することが多いけれど、人工知能が既存コンテンツを"参考にする"ことはどこまで許されるのだろうか？

法律に関してはほとんど無知なのでちょっと調べてみたが、著作権法の47条に情報解析目的なら著作物を自由に使ってよいとあった。

（情報解析のための複製等）第四十七条の七　著作物は、電子計算機による情報解析（多数の著作物その他の大量の情報から、当該情報を構成する言語、音、影像その他の要素に係る情報を抽出し、比較、分類その他の統計的な解析を行うことをいう。以下この条において同じ。）を行うことを目的とする場合には、必要と認められる限度において、記録媒体への記録又は翻案（これにより創作した二次的著作物の記録を含む。）を行うことができる。ただし、情報解析を行う者の用に供するために作成されたデータベースの著作物については、この限りでない。

じゃあWebから集めたテキスト・画像・動画・音声・音楽を人工知能に与える訓練データとして使う場合は「情報解析」に当たるとみなしてOKってことだろうか？そこから新しいコンテンツを生成して自分が作ったと発表してもOKなのだろうか？具体例がなく「その他の統計的な解析」、「必要と認められる限度」のような曖昧な表現があってどこまでOKなのかこれではわからない・・・ここら辺の議論はもう決着しているのかな？

先の記事で取り上げられたシステム以外にも人工知能によるコンテンツ生成に関する技術は近年盛んに研究されていて個人的にすごく興味を持っている。流行りのDeep Learningが多いけれど、Darwin Tunesのように遺伝的アルゴリズムが使われる例もある。来年はここら辺の技術をメインにとりあげていきたい。

キャプションの自動生成 - 画像からテキストを生成
画像の自動生成 - Deep Convolutional Generative Adversarial Networks (DCGAN)
イラストの自動生成 (1) - DCGAN
イラストの自動生成 (2) - DCGAN
画風の変換 - A Neural Algorithm of Artistic Stlye
画風変換の解説 - Chainer-Gogh
楽曲の自動生成 - Recurrent Neural Networks
自動作曲サービス - Jukedeck、人工知能らしいが詳細な仕組みは不明
メロディ進化 - Darwin Tunes、遺伝的アルゴリズム

人工知能に関する断創録

このブログでは人工知能のさまざまな分野について調査したことをまとめています（更新停止: 2019年12月31日）

人工知能によるコンテンツ生成と著作権