Zoom、リアルタイム翻訳のスタートアップKitesを買収
コメント
選択しているユーザー
Speech to speech translation技術は speech to textより(当たり前ですが)難しく、Skypeなども数年前から挑戦しているものの、正確性的にはまだ頼りになっていない状態です。Speech to speechリアルタイム通訳は、ZoomやSkypeのようなシステムにあと数年で欠かせない機能になてくるはずです。その時までのスピードが勝負ですが、それに一番必要なことは音声学習データであり、Zoomが次そういった企業を買収するのではないかと思います。
それでいうと、弊社も遠隔通訳プラットフォームで(人間によるリアルタイム通訳)、音声通訳データが資産なので、Zoomがいつか話に来てくれたらいいなーと 笑
注目のコメント
ソースネクスト社のポケトークが登場した際完成度の高さに驚いたが、翻訳は極めて高次な作業であるため、ITでの代替が難しい。
リアルタイム翻訳はその極みで、「音声認識」+「テキスト認識」+「文化認識」に加え、即応性が加わる。即応性が肝で、処理時間やアルゴリズム自体の問題で、即応性が遅くなる。
翻訳の精度はかなり高くなってきているが、やはり、即応性が肝だろう。10秒以上かかるのか、3秒以内でできるのか。10秒以上かかると恐らく会話が会話でなくなるので、普及しない。
「3秒」は、私の肌感覚で書いたが、人間が心理的に待てる限界のような気がする。1回の翻訳であれば、10秒以上かかってもストレスがないが、会議等でコミュニケーションが連続する環境では、恐らく、それぐらいが限界だろう。
まさに、ドラえもんの「ほんやくこんにゃく」の世界は速く実現してほしい。