経済情報特化の生成AI、日経が開発 40年分の記事学習 - 日本経済新聞
コメント
注目のコメント
生成AIの活用において、これからの時代は「量」から「質」へのシフトが求められています。具体的には、単に大量のデータを学習させるのではなく、どのように質の高いデータを選定し、活用するかが重要になるでしょう。この観点から注目すべき例として、この事例では、日経新聞が独自に収集した高品質なデータを用いて生成AIを訓練し、顕著な成果を上げています。
新聞社としても、長年にわたり蓄積した膨大な記事データベースや取材データがあります。これらを生成AIの訓練に有効活用することで、より深い洞察を提供する高品質なコンテンツを生成することが可能です。例えば、経済分析の精度を高めるために、過去の経済危機に関する詳細な記事を学習データとして用いることが考えられます。
メディアは著作権絡みで生成AIのトレンドをただ批判するだけではなく、メディアの進化の波として正しく捉えるべきです。そのためには、質の高いデータを選び、効果的に活用することが必要です。新聞社が持つデータの「濃さ」や「質」に着目し、これをAI技術と組み合わせることで、メディアとしての新たな価値を創造できるはずです。日本経済新聞が独自の大規模言語モデル「NIKKEI Language Model」を開発…!これはすごい。
これにより、発表情報や株式相場などに基づく記事は完全にAI任せにできる基盤ができたことになる。そしてAI記者の実用化が見えてくる。
日経MJや日経BPの記事も学習データになっているので、経済情報に限らずかなり高精度で汎用的な日本語LLMになっているはず。日本語の生成AIを進化させていくうえで極めて重要な動きなのだが、これがオープンになれば画期的なのだけど。日経新聞のデータセットは権利や倫理、信頼性や網羅性を含めて企業が活用しやすそう。日経テレコンの進化版みたいなサービスになるんですかね。
40年分のデータを学習して未来を予測させたら、どんなシナリオを書き出すか試してみたい。