サイバーエージェント、独自の日本語LLMを開発--広告クリエイティブ制作領域で活用
コメント
注目のコメント
オンライン広告においては、さまざまな生成パターンに対してその効果を計測できる環境があります。ここ数ヶ月で発達してきたAI技術には、学習済みのモデルの出力をこのようなインプットを元に素早くチューニングできるLoRAなどの技術があります。これまでAIモデルの再学習には大規模な計算が必要でしたが、動的に、連続的にモデルのトレーニングが行えるようになってきました。
このような前提を踏まえると、広告にはとても面白い可能性が秘められています。ただ、宣伝と詐欺は紙一重なところもあり、技術が人を騙すことや、さらには世論の操作などに使われる可能性もリアルに感じられます。LLMの性能の参考となるパラーメータ数は130億。日本語の広告という用途に絞れば、十分なのかも。
参考までにGPTと比べると、GPT-2とGPT-3の間
GPT-2:15億
GPT-3:1750億
ChatGPT(GPT-3.5):3500億(という噂)
GPT-4:100兆(という噂)
今年の1月末にGPUサーバー80基を導入したようで、投資が活きたのでしょう。40億円くらいと予想。
大規模なAI開発に対応する「NVIDIA DGX H100」を国内初導入 -80基の「NVIDIA H100 Tensor コア GPU」でAI開発を大幅強化、機械学習モデルの大規模化・構築の高速化へ
https://www.cyberagent.co.jp/news/detail/id=28484昨日LINE&ソフトバンクが和製ChatGPTの開発を宣言した矢先、「開発した」と一歩先行くサイバーエージェント、さすがです。
AIが創発的な能力を発揮するという「スケーリング則」のラインになる130億のパラメーター数も押さえていて、その精度にも期待です。
ただ、生成AIは、やはり文章を生成するための"機能"に過ぎません。この機能を活かし、どのような価値をユーザーに提供できるかが本質として問われていくはずです。
足元は広告クリエイティブ制作の高度化・効率化という活用が主となりそうですが、今後、広告のパーソナライズ化などへの進展をはじめ、日本企業による日本人のための生成AIの真価が、これから見られることを楽しみにしたいと思います。