動画生成AIがすごすぎる 映画登場も遠くない
コメント
注目のコメント
ChatGPTなどの文章生成AI、Stable Diffusionなどの画像生成AIの影に隠れがちですが、動画生成AIも着実に進化を遂げてきています。
動画生成AIはインプットデータの違いから
・Text to Video(テキスト→動画)
・Image to Video(画像→動画)
・Video to Video(動画→動画)
に大別できますが、とくにText to Videoは、Runway社のGen-2をはじめ多くのモデルが登場している印象です。
とはいえ、動画の生成秒数としては4-6秒程度、その質もまだまだというところで、記事タイトルの”すごすぎる”は、やや誇張した感じがあるかなというのが個人的な感想ではあります。
一方で、先日アメリカの映像制作会社The Simulationが発表した研究(複数のAIエージェントが住む仮想の街で起きた出来事を動画にして生成するもの)は良くも悪くも話題になりました。(https://www.itmedia.co.jp/news/articles/2307/31/news054.html)
ChatGPTのような文章生成ほどではないにしても、動画生成の技術は確実に高度化しており、数年後には精度も向上し、とくにクリエイティブ・デザイン領域では活用が進められていくことが予想されます。おそらく映像生成AIの最大の市場はメタバースです。仮想キャラや背景が自然に動くようになれば、仮想世界の構築が一気に低コスト化します。一人称視点なら、3Dモデルで無く映像の方がリアルな体験を作りやすいはずですから。
来年のスマートグラスの登場に合わせて、映像生成や3Dモデル生成が盛上がりそうな予感がします。風景のCGを生成する事はできるみたいですね。
ただ、人物描画して演技できるかというと正直無理だと思います。
一瞬を切り抜いた画像では違和感なくても、動いてセリフを言えば違和感ないものを作るのは難しいです。
お札の肖像画を偽造防止に使うように人は人の表情には敏感ですが、AIがそこまで表現できますか?