生成AIや量子通信に589億円 国産支援、総務省概算要求
コメント
注目のコメント
何はともあれ日本語データセットに予算がついたのは良い取り組みです。
•新聞や通信社等メディアの著作物、小説や映像台本等の商業著作物の利用権購入
•医学や工学等の専門書籍や論文の利用権購入
•会話トレーニングのデータセット作成
•人間フィードバック強化学習に役立つ比較データセット
あたりが充実すると、実用化が進むと期待します。生成AIに関しては、「国産生成AI開発強化に向けた日本語中心の言語データ基盤整備」に10億円の予算要求とのことです。
あくまでLLM(大規模言語モデル)の開発そのものではなく、そのためのデータ基盤整備からスタートということのようですが、この金額規模感をどう見ればいいのかはなかなか難しいところです。
先日、OpenAIがChatGPTの運営に1日あたり1億円のコストがかかっていて破産の可能性があるといった報道も出ていたほか、以前にはマイクロソフトがOpenAIに1兆円近くを投資するといったニュースや、ChatGPTの開発には数百億円がかかるといった話題もあったりなど、いずれもその真意は定かではありませんが、海外モデルの桁違いな投資状況が想像されます。
中身が異なるため単純な比較はできませんし、近年はLLMのモデルサイズを縮小させてより低コストな学習・開発ができるようにもなってきているため、金額だけで判断することはできませんが、今般の概算要求が、日本人にとって価値ある国産LLMの開発に向けた後押しとなる予算として活用されることを期待したいところです。NICTに生成AI予算を10億円。文科省は理研にドンと出す。経産省も産総研に出すんでしょう。問題は、3省3機関を統合し、産学官の連携・分担で描く総合的な国家戦略。日本の弱みはそこです。官邸・内閣府・自民党での議論に期待します。