OpenAI、New York Timesによる著作権侵害提訴は「法的根拠なし」と公式ブログで反論
コメント
選択しているユーザー
OpenAIとNYTの間のこの訴訟は、AI技術の急速な進化と既存の著作権法の間の緊張を浮き彫りにしています。一方で、AIのトレーニングには広範なデータが必要であり、その一部は既存の作品に由来する可能性があります。他方で、著作権者は自身の作品が無断で使用されることに対して懸念を抱いています。この問題は、AIの未来と著作権保護のバランスをどのように取るべきかという、より大きな問題を提示しています。皆さんは、このような法的論争にどのような解決策を見出すことができると思いますか?
注目のコメント
著作権のあるコンテンツで学習したことは認めつつ「トレーニングはフェアユース」という主張に変わってきました。日本の著作権法でもトレーニングはokですが、世界でも法的に明文化したのは画期的でした。米国の司法判断が待たれます。
一方で、著作権侵害サイトのデータセットで学習したのではという疑念は残ります。あるいは研究目的に限定されたデータセットで。さらには違法サイトのコンテンツが含まれると指摘されたデータセットもあります。
学習データセット問題は当面大きなリスクとなりそうです。日本企業は訴訟リスクを抱えて開発する余力に乏しいでしょう。それが心配です。フェアユースの範囲は曖昧なので、裁判所の判断が待たれます。ただ、学習データを場合によってはそのまま吐き出すということは実際に起こることです。とはいえ、これが普通に使われている上で、全体のアウトプットの中ではごく一部という指摘もあり、「学習データを再現することが可能なこともある」、という事実を持って著作権侵害とどこまで言えるのか。
ニュースは今起きていることをジャーナリストの視点を通して正確かつ深く洞察して発信する媒体で、ChatGPTはモデルの学習が行わなければ知識が古いままなので、常に半年ほど前の情報が出てきます。
今回のNYTの訴状にある原文とGPT4が出力した文章はほぼ一致しますが、過去のニュースがGPTから出たとして日々のニュースを解説することに価値のあるNYTのビジネスにどれほど影響しているかは疑問に思います。
むしろ、NYTとしては積極的に記事を提供してOpenAIから対価をもらうビジネスモデルに転換するのも一手だと思います。
また、過去のニュースにGPTを通してユーザーが出会い、その出典としてNYTに飛び、GPTを使ってスラスラ読めるようにすればNYTのファンが出来て購読者が増える可能性もあるでしょう。
結局のところは、GPTが浸透したら文字を書く記者が失業しかねないという危機感からの拒否感が根幹にあり、さまざまな理由をつけて提訴に至っているように思います。