【深刻】AI巨大企業の「モラルなきデータ戦争」がかなり酷い
NewsPicks編集部
266Picks
コメント
選択しているユーザー
ChatGPTなどの生成AIは、すでにデータの壁に突き当たっているとのこと。インターネット状のデータはほぼすべて収集しつくし、著作権保護の情報にもアクセスしようとしている。倫理なき戦い。
注目のコメント
公開コンテンツが尽きた後、次に狙われるのは企業内文書データでしょう。
大企業は許可するはずもありませんが、中小企業が無料版オフィススイートを使うなら学習すると宣言する日は近いかもしれません。
特に企画や計画、設計といったクリエイティブな仕事はAIの助けが極めて役立ちます。企業が競争に勝つためにデータを差し出す未来が見えます。
これはコンサル破壊でもあります。かなり危惧しています。マスク氏がツイッターの有料化を進めるときにも「第三者に大量のデータを無料で盗まれる」的な発言をしていた記憶があります。わかっている人はずっと前から分かっていたのに、「不都合な真実」はいつもずいぶん遅れて一般に開示されるんだなあと感じました。
皆さんのご意見の中に「AIがAIの学習データを作る」というのが散見されるので、それについてコメント。学術的にも意見が分かれていて、役に立つとする論文と、害になるという論文があります。画像認識的には、AIはAIが生成した画像をきちんと区別しているらしく(特徴量の分布が自然画像と明らかに違います)、AIで生成されたデータを追加で使ってもうまく学習が進まなかったり、逆に害になったりすることが多いです。見た目には普通の自然画像と変わらないのに不思議です。ただ、この問題をどうやってクリアしていくかが大いなるチャレンジの1つとなっています。また、上記の現象を使えば、ある程度フェイク画像の見分けもできる可能性があります。