1. トップ
  2. 新着ニュース
  3. ライフ
  4. カルチャー

生成AIの学習は合法なのか? 日本の著作権法における生成AIの学習の論点。今後危惧される「人間の声」のディープフェイク

集英社オンライン / 2024年2月9日 11時1分

昨今、企業の広告にAIで生成されたバーチャルヒューマンが起用されているが、そもそも法律的には問題ないのだろうか。いま現在の日本の法律では厳密に規制することは難しい状況だという。AIと倫理、法の規制をわかりやすく学ぶことができる書籍『生成AIで世界はこう変わる』より日本の現状と、物議を醸している「人間の声」のディープフェイクについて一部抜粋して解説する。

生成AIは学習データを無断で使用していいのか?

ここからは、生成AIに関して巻き起こっている議論を掘り下げたいと思います。

生成AIと呼ばれているAIのほとんどは、学習のために膨大なデータを必要とします。もっとも、これは生成AIに限った話ではなく、われわれが普段何気なく使っているサービスの背後にある、生成を目的としないAIでも同じことです。これは、現在の人工知能技術の主流で生成AIの基盤技術となっている機械学習・ディープラーニングの本質的な性質が、「膨大なデータから学習することで、とてつもない性能を発揮できる」ことに起因します。



これらのAIを運用しているのは、Google、Amazon、Meta、Appleのように、インターネット上で多くのデータを収集している企業、あるいはWebのクローリングによってデータを収集しているOpenAI社や大学のような組織です。

われわれはこれらのサービスを日常的に、背後にあるAIの学習データを意識することなく利用していますが、ほとんどの場合、学習のもとになるデータは、普通にインターネットを使用している一般ユーザーが生み出した文章や画像です。つまり、これらのデータは、生み出したユーザーが著作権者として権利を持つ著作物です。

しかし、インターネット上になんらかのコンテンツを投稿したことがある人で、Googleなどからデータの使用許可の要請を受け取った人はまずいないでしょう。基本的にほとんどの場合、これらの著作物を許可なくAIの学習に使うこと自体は合法です。

これまでは、そのことで被害を受けたという意識を抱く人は少数でしたが、生成AIブームによって、このようなデータを用いた学習が注目を集め議論となっています。

文章の執筆を生業とする作家や翻訳者もそうですが、特にイラストなどの創作活動を行う業界でこのことが問題視されています。「無断学習」という言葉を用いて、生成AIの使われ方以前の問題として、生成AIの学習の是非について問う声も大きくなっています。

最も極端なものになると、「無断学習されたAIを(生成目的で)使うべきではない」とする主張も見られます。

強く規制すると、
あらゆるサービスの利用が阻害される

今後、生成AIについてガイドラインや努力義務の設計、場合によっては立法も含めたなんらかのルールづくりが進むことについては間違いないでしょう。それに向けた意見の表明なども歓迎されるべきものです。

一方で、これはおそらく生成AIの学習自体を規制するものではなく、その使用段階が対象としたものが主になると思われます。

前提として、日本においては著作権法30条の4によって、原則としてインターネット上の著作物を、著作権者の許可を得ずにAIの学習などの情報解析目的に使用することは、商用利用も含めて合法とされています。つまり、情報解析目的の場合は著作者の権利が制限され、許諾を得ずに著作物を利用してもいいということです。

現在の生成AIの基盤技術を支える「膨大なデータから学習することで、とてつもない性能を発揮できる」という性質を考えると、何千万、何億という膨大なデータに対してひとつひとつ許諾を求めるのは現実的ではありません。許諾を得られないことを理由に学習を諦めれば、人に多くの恩恵をもたらすAIの力を発揮することができません。

著作権法30条の4は、こうしたAIも含めたITサービスの恩恵を最大限に受けられるよう成立したという背景があります。

もちろん著作権法30条の4も、無制限に適用されるわけではありません。これが適用されるのは、「当該著作物に表現された思想又は感情を自ら享受し又は他人に享受させることを目的としない場合」に限られ、「当該著作物の種類及び用途並びに当該利用の態様に照らし著作権者の利益を不当に害することとなる場合は、この限りでない」というただし書きが付いています。

現在の日本の著作権法の範囲内で、生成AIの学習について議論すべき焦点があるとすれば、この部分でしょう。

ただ、これについても生成AIの学習段階では、文章や画像の一般的な概念・アイディアを獲得することが目的であることから、享受目的には該当しないという考えがあります。ただし書きの適用についてもかなり限られた状況を想定していることから、現時点では学術・法曹・行政の解釈では問題ないという考えが主流です。

これについては、少なくとも創作分野に関わる生成AIについて、本書の執筆時点では決着がついているとは言いがたく、最終的に司法の判断を待つ形になるでしょう。

生成を目的にしていたかどうか

生成AIを問題視する側の意見は、そもそもこのような著作権法(外国ではアメリカのフェアユース規定など)が現状に対応しておらず、生成AIの学習自体を規制する法改正を求めるというものです。

ただ、すでに述べたように、このような学習自体を禁ずる方向の規制は(少なくとも法律レベルでは)考えにくいでしょう。このような学習を規制することによって、巻き込まれる範囲があまりにも広すぎます。

仮に「著作物を学習データとするAI」について、「学習に使用するデータの著作権者の許可を取っていない」ものを規制する法律ができたとしましょう。当然、今存在する画像生成AIなどはほぼすべて規制されることになります。ここまでは規制を求める側の希望通りでしょう。

しかし同時に、われわれが日常的に使用するインターネット上のサービスの相当数も規制されます。Googleなどの検索サービスから、スマートフォンに初期搭載されているようなアプリまで、検索、写真の加工機能などの背後にはこのような学習を行ったAIが数多く存在します。

「これまでのサービスの背後にあるAIは、生成を目的にしていなかった。今の生成AIとは違う」という意見もありえます。では、先ほどの規制の対象を「著作物を学習データとするAI」から、「著作物を学習データとするAIのなかでも、生成的な動作を行うもの」に変えるとどうなるか。

これでも状況はほとんど変わりません。この場合でも、生成AIの学習に反対している人でも日常的に使っているであろう翻訳サービス、動画サービスの文字起こし、デジタルペイントツールの自動彩色機能など、多くの機能やサービスが巻き添えとなって規制されてしまいます。未来に目を向ければ、人類に恩恵をもたらすであろう革新的な情報科学技術の発展を阻害することになります。

このように、そもそも生成AIが行っているような学習は、本来はそこまで特別なものではなく、人びとがそれと意識せずに利用していた多くのITサービスの背後で動いているAIにも適用されているのです。

一方で、すでに現在の生成AIでも、その使い方に問題がある事例が多く観測されているのも事実です。

使用段階において、明らかに現行法を適用できるものや適用を検討できそうなもの(たとえば特定の著作物をAIで改変して公衆送信すること、特定のクリエイターの作品を集中学習させたモデルを使用することなど)については、そのまま対処・ガイドラインを公表しつつ、それでも取り締まれない問題となる使用については、立法も視野に入れるべきでしょう。

人間の「声」

ここまでの話は、著作権法により(議論はあれど)保護の範囲がある程度明確な画像などの著作物を対象としたものでしたが、その範囲がこれらほど明確な形で示されていないものも存在します。本書の執筆時点ですでに物議を醸している、人間の「声」がその例です。

現在の最先端の生成AIは、短い声のサンプルがあれば、学習対象による発声と区別がつかないレベルで自由にセリフや歌などの音声データを生成できます。人間の声は生得的で個人に特有のものであり、認証に利用されるなど個人の属性を強く反映するものです。

その点で、画像や音楽とは異なるレベルでの保護が必要であるとも考えられますが、AIによる声の学習や生成行為については、著作権だけでなく肖像権なども含めた複雑な要素があり、議論が続いている状況です。

現時点で出されている見解の1つは、無断でAIによって特定の声優、著名人などの声を生成して商用利用する行為については、それが当該人物の声と認識されるものであれば、パブリシティ権侵害に当たるというものです。特定の声優の声を無断で学習したAIによる発声や歌唱を公開するといった行為が発生していますが、この見解に基づけば、そのいくつかは規制の対象になる可能性が高いでしょう。

ここまで見てきたように、生成AIの学習や生成について、何もかもを法律で規制することは現実的には困難です。法的な規制が難しい部分は、生成AIの開発・利用者の努力義務にとどまるでしょう。

ただ、その努力義務に対する取り組みが、生成AIによるサービスを提供する企業にとっての価値の一部になることも考えられます。たとえば学習について、法的な一括規制は難しくとも、「学習に使用されたくない」という希望を受け入れ、学習データから除外する努力を開発側から行うことは検討されるべきです。

OpenAI社は、学習に使うデータを収集する「GPTBot」のクローリングをブロックするための手順を公開しています。加えて、学習データの透明性、著作権者への収益の還元なども、現実的な範囲で検討が進むことが期待されます。


図/書籍『生成AIで世界はこう変わる』より
写真/shutterstock

生成AIで世界はこう変わる(SBI新書)

今井翔太

2024年1月7日

990円

256ページ

ISBN:

978-4815622978

新進気鋭のAI研究者が大予測! 生成AIで変わる私たちの仕事・くらし・文化

話題の生成AI、どこまでなにができる?AIって結局、どんなしくみで動いているの?
最新テクノロジーで私たちの仕事は奪われる?AIで働き方や生活がどう変わるのか知りたい…

ChatGPT、Bing、Claude、Midjourney、Stable Diffusion、Adobe Firefly、Google Bard…今世紀最大ともいえる変革を全世界にもたらした、生成AI。

この時代を生きるわたしたちにとって、人工知能をはじめとする最新テクノロジー、そしてそれに伴う技術革新は、ビジネス、社会生活、娯楽など、多様な側面で個々人の人生に影響を及ぼす存在となっています。

ただでさえ変化スピードが速く、情報のキャッチアップに苦戦するテクノロジー領域。数か月後には今の状況ががらりと変わってる可能性が非常に高い…そのような状況下で、今私たちは生きています。

ホットな話題でいえば、「クリエイターはみなAIに取って代わられるのでは?」「人間にしかできない価値創造ってなに?」など、これまで当たり前だと信じて疑わなかった「労働」「お金」「日常生活」などのパラダイムシフトが起こっています。

そんな今、まさにみなさんに手に取っていただきたいのがこの1冊です。この時代を生きる多くの方が抱いているであろう不安や疑問、そして未来への興味関心に、本書はお応えします。本書では、AI研究の第一人者である東京大学教授・内閣府AI戦略会議座長を務める松尾豊氏の研究室所属の今井翔太氏が、生成AIで激変する世界を大予測!

この記事に関連するニュース

トピックスRSS

ランキング

記事ミッション中・・・

10秒滞在

記事にリアクションする

記事ミッション中・・・

10秒滞在

記事にリアクションする

デイリー: 参加する
ウィークリー: 参加する
マンスリー: 参加する
10秒滞在

記事にリアクションする

次の記事を探す

エラーが発生しました

ページを再読み込みして
ください