OpenAIの「Voice Engine」は15秒分の声データを元に本人そっくりに喋る

ITmedia

2024/03/30

540

Picks

このまま本文を読む

本文を読む

選択しているユーザー

本永なお
株式会社ミーミル(News Picks expert運営) Team leader
・2024年03月30日
楽しそうと思ったものの、アイドルとか芸能人からしたら脅威ですよね。

注目のコメント

和田崇
㍿Laboro.AI 執行役員／マーケティング部長
・2024年03月30日
OpenAIの生成AIの普及の流れとしては、
・DALL•Eの画像生成（Text to Image）、
・ChatGPTのテキスト生成（Text to Text）、
・Soraの動画生成（Text to Video）、
・Voice Engineの音声生成（Text to Voice）
と、インプット側のテキスト入力は一定ながらアウトプット側は、言語、画像、動画、音声とマルチモーダル化が着実に進んでいます。

恐らく次はインプット側のマルチモーダル化が進むはずで、すでに画像→テキスト（Image to Text）など一部は可能になっていますが、音声→動画などの生成もサービスとして利用可能になっていくはずです。

伴って心配されるのが、やはり規制・法整備のルールの部分で、人権に配慮した技術進展がより求められることになりそうです。
堀江貴文
Interstellar Technologies K.K. Founder
・2024年03月30日
フェイクに騙される人続出だな
松本国一
富士通株式会社シニアエバンジェリスト　最新著書「20分で誰でもわかるサイバーセキュリティ超入門」
・2024年03月30日
簡単に人を真似て話をさせる事ができる時代になりました。
使いようによっては、自分の変わりに介護応答させたりスピーチさせたりと効率を上げるための使い方もできるでしょう。
一方で詐欺などに活用されると大きなリスクになります。

だから技術開発を止める。という選択肢はありません。
そういう事ができる時だである事が前提で社会の仕組みを変えていく時代になってきました。

.css-5ddv2h{font-feature-settings:'palt';letter-spacing:0.06em;}OpenAIの「Voice Engine」は15秒分の声データを元に本人そっくりに喋る

コメント

選択しているユーザー

注目のコメント

OpenAIの「Voice Engine」は15秒分の声データを元に本人そっくりに喋る