【ミニ教養】ChatGPTが「メディア」を食べだした
コメント
注目のコメント
OpenAIが大手ドイツメディアとのパートナーシップを組み、ニュースに入り込もうとしています。お相手はビジネスインサイダーやポリティコという大手ネットメディアを買収した巨大メディアであるアクセル・シュプリンガー。
思えばFacebookやGoogleとニュースメディアとの関係は特殊でした。時にはコンテンツ増加と広告事業の強化が見込める良きパートナーで、時にはどちらに滞在してもらうか競うライバルで。
生成AIにとってのメディアは、多量の学習テキストと参照元となるでしょう。
ChatGPTを最新の情報に浸らせることは、メディアにとって凶か吉か。あるウェブサイトがOpenAIを受け入れているかを知る一つの目安になるのがrobots.txtを調べることです。
これは簡単で、ウェブサイトのURLの後ろにrobots.txtと付け加えるだけです。例えばこの記事で取り上げられているBILDだとこんな感じ。
https://www.bild.de/robots.txt
robots.txtは店の店頭に張り出されている「次のお客様は入店お断り」のような機能も持っています。現時点は”User-agent: GPTBot Disallow: /”とあるので「OpenAIのデータ収集クローラー(GPTBot)は入店お断り(Disallow)」とBILDは意思表示していることになります。
そして現時点で世界の上位1000サイトのうちおよそ3割が「OpenAIは入店お断り」との意思表示をrobots.txtを通じて行っています。
Websites That Have Blocked OpenAI’s GPTBot CCBot Anthropic Google Extended - 1000 Website Study
https://originality.ai/ai-bot-blocking
特に通信社を除いて上位ニュースサイトは割と全滅です。
生成AIによるチャットボットがユーザーの情報アクセスの上流を握るようになる現在の変化の類似例を歴史に探すなら、それはGoogle等の検索エンジンになると思います。
例えば検索エンジンの発展と歩調を合わせてウエブサイト側がrobots.txtやメタタグといった技術を用いて検索エンジンによるデータ収集やデータの扱いをある程度制御できる紳士協定が確立していきました。
また「検索」にとって一致する情報の発見以上に重要なのがランキングで、元々は注目度の高い情報を上位に表示するだけでよかったのが、現在は加えて情報の正確さ、政治的中立性、ダイバーシティといった観点からも社会から監視され、それに応えた継続的な改善が検索エンジン側にも求められています。
ChatGPTなどがあまりにも衝撃的だったため、OpenAIなどもフリーハンドで今後もやりたい放題のような論調がどうしても先行しますが、実際には社会との界面でのすり合わせは必要で、これは必ず起こるでしょう。ChatGPTがパブリッシャーのコンテンツを参照した場合、原典とリンクが明記されるようになるとのこと。パブリッシャーとしては、新たな顧客獲得チャネルになり、収益源となる可能性があります。
メディアとしてはオープンにすることで、アクセスが減るという懸念がありますが、これが守られれば、逆にアクセスが増える。