• 特集
  • 番組
  • トピックス
  • 学び
プレミアムを無料で体験

OpenAIの「Voice Engine」は15秒分の声データを元に本人そっくりに喋る

541
Picks
このまま本文を読む
本文を読む

コメント


選択しているユーザー

  • badge
    一般社団法人ノンプログラマー協会代表理事 株式会社プランノーツ代表取締役

    OpenAIは人の声を再現できる生成AIモデル「Voice Engine」を発表。

    テキスト入力と15秒分の音声サンプルで、元の話者によく似た自然な音声を生成できる。感情的なリアルな音声で、母国語以外の言語も話せるとのこと。

    OpenAIは「重大なリスクがある」として広範囲のリリースには慎重な姿勢を示しています。

    声は「その人らしさ」をストレートに表現できる最も適した方法と考えられていますが、それもAIで代替できるようになる…近い将来、それが当たり前になったとき、情報の授受の世界がどう変わり何が起きるのか、リアルに声で伝えることに残される価値は何なのかなどなど、予想しておく必要がありますね。

    僕もVoicyでの音声発信を続けていますが、その価値も変わっていくのでしょうか。考えねばなりませんね。


注目のコメント

  • badge
    ㍿Laboro.AI 執行役員/マーケティング部長

    OpenAIの生成AIの普及の流れとしては、
    ・DALL•Eの画像生成(Text to Image)、
    ・ChatGPTのテキスト生成(Text to Text)、
    ・Soraの動画生成(Text to Video)、
    ・Voice Engineの音声生成(Text to Voice)
    と、インプット側のテキスト入力は一定ながらアウトプット側は、言語、画像、動画、音声とマルチモーダル化が着実に進んでいます。

    恐らく次はインプット側のマルチモーダル化が進むはずで、すでに画像→テキスト(Image to Text)など一部は可能になっていますが、音声→動画などの生成もサービスとして利用可能になっていくはずです。

    伴って心配されるのが、やはり規制・法整備のルールの部分で、人権に配慮した技術進展がより求められることになりそうです。


  • badge
    Interstellar Technologies K.K. Founder

    フェイクに騙される人続出だな


  • badge
    富士通株式会社 シニアエバンジェリスト 最新著書「20分で誰でもわかるサイバーセキュリティ超入門」

    簡単に人を真似て話をさせる事ができる時代になりました。
    使いようによっては、自分の変わりに介護応答させたりスピーチさせたりと効率を上げるための使い方もできるでしょう。
    一方で詐欺などに活用されると大きなリスクになります。

    だから技術開発を止める。という選択肢はありません。
    そういう事ができる時だである事が前提で社会の仕組みを変えていく時代になってきました。


アプリをダウンロード

NewsPicks について

SNSアカウント


関連サービス


法人・団体向けサービス


その他


© Uzabase, Inc

マイニュースに代わり
フォローを今後利用しますか