【深刻】AI巨大企業の「モラルなきデータ戦争」がかなり酷い

NewsPicks編集部

・2024/04/15

266

Picks

このまま本文を読む

本文を読む

選択しているユーザー

佐藤元則
NCB Lab. 代表
・2024年04月15日
ChatGPTなどの生成AIは、すでにデータの壁に突き当たっているとのこと。インターネット状のデータはほぼすべて収集しつくし、著作権保護の情報にもアクセスしようとしている。倫理なき戦い。

注目のコメント

比屋根一雄
三菱総合研究所執行役員兼研究理事生成AIラボセンター長
・2024年04月15日
公開コンテンツが尽きた後、次に狙われるのは企業内文書データでしょう。

大企業は許可するはずもありませんが、中小企業が無料版オフィススイートを使うなら学習すると宣言する日は近いかもしれません。

特に企画や計画、設計といったクリエイティブな仕事はAIの助けが極めて役立ちます。企業が競争に勝つためにデータを差し出す未来が見えます。

これはコンサル破壊でもあります。かなり危惧しています。
清水勝彦
慶應ビジネススクール教授
・2024年04月15日
マスク氏がツイッターの有料化を進めるときにも「第三者に大量のデータを無料で盗まれる」的な発言をしていた記憶があります。わかっている人はずっと前から分かっていたのに、「不都合な真実」はいつもずいぶん遅れて一般に開示されるんだなあと感じました。
山崎俊彦
東京大学大学院情報理工学系研究科電子情報学専攻　教授
・2024年04月15日
皆さんのご意見の中に「AIがAIの学習データを作る」というのが散見されるので、それについてコメント。学術的にも意見が分かれていて、役に立つとする論文と、害になるという論文があります。画像認識的には、AIはAIが生成した画像をきちんと区別しているらしく（特徴量の分布が自然画像と明らかに違います）、AIで生成されたデータを追加で使ってもうまく学習が進まなかったり、逆に害になったりすることが多いです。見た目には普通の自然画像と変わらないのに不思議です。ただ、この問題をどうやってクリアしていくかが大いなるチャレンジの1つとなっています。また、上記の現象を使えば、ある程度フェイク画像の見分けもできる可能性があります。