アマゾンが「音声合成」サービスに本格参入
コメント
選択しているユーザー
インディーズゲーム開発について最近調べているのでその観点から。
プログラミングやシステム構築を除くとネックとなるのが以下のもの。
・イラスト,背景,3Dモデル
・BGM,効果音
・ボイス
このうち、上記2つはフリー素材や低価格素材が充実している。一方で、ボイスは声優をあてがう必要がありマンパワー100%がかかる。
1億人総クリエイター社会に近づくためには、1番のフロンティアだと思います。
注目のコメント
クラウドで処理するので、
人工知能で分析することで、
抑揚のつけ方を学び続けて、
どんどん自然なしゃべり方に近づいていくこと、
新しい用語や流行語もすぐに覚えて対応できる
ことが強みでしょうか。
「利用者は自前のシステムを用意したりソフトを購入したりする必要がなく、100万文字で440円と格段に安く利用できる」
「国内では、和歌山市にあるコミュニティーFMが、アナウンサーの代わりにニュースや天気予報を読むのに利用している」
「小さな放送局でアナウンサーを探すことが難しいので、とても助かっています。また、大きな災害などで人が来ることができない間も安定して放送を出せると期待している」」クラウドでAI。進化し続け、スケールメリット。これにオンプレで立ち向かうのは、大人に子供が喧嘩するようなものか…「クラウド…100万文字で440円と格段に安く利用できるとしています。また大量の音声データを人工知能で分析することで、自然な抑揚のつけ方を学び、新しい用語や流行語も直ちに覚えて発音できるということです」
Amazon Pollyの日本語は、Mizukiという女性みたい。Watsonの日本語も女性だけだったし、日本語は女性の声の方が先行するけど、Watsonやってた時は意外に男性の声のニーズもあった。
https://aws.amazon.com/jp/polly/