ホーム
1フォロー
2フォロワー
ChatGPT、“目”と“耳”の実装を発表 写真の内容を認識、発話機能でおしゃべりも可能に
ITmedia NEWS
Kohno MichinariNeoma Design 代表取締役, 体験クリエイター, BXUXディレクター, 元ソニーUXデザイナー
「音声対話」と「音声で入力し、音声で出力する」ことは全く次元が違うことをまず理解しなければならない 音声対話UI・UXデザインを長年専門的に研究開発している立場としてコメントすると、今回の ChatGPT の実装においての、目と耳と口が実装されたことは今後色々期待できる。 しかし、口(音声出力)については、文字での対話(音声対話ではない)を単に音声合成つかっただけである。 口語と文語との違いを我々人間は使い分けているように、文語(文章としての言葉)をそのまま音読するしていてはコミュニケーションがうまくいかないのは想像すればわかることだろう 。 メールの読み上げるのと、メールの内容を実際口で話すのでは話し方、語末、使う単語が変わるのは想像できるはずで、これまでのスマートスピーカーの音声対話(Voice U)の失敗は、まさにこの口語と文語の違いをUIデザイン、UXで吸収できていないからである。 よって、今後 ChatGPT やこれらを使ったサービスにおいて、音声対話を行うのであれば、口語という部分をしっかり意識し、口語的なインタラクションができる技術を開発しなければならない。
824Picks
NORMAL