東芝、オンライン授業を字幕化 AI活用、慶応・法政大で実験
時事ドットコム
184Picks
コメント
注目のコメント
便利だと思う反面、受講中に「あとで見返せるからいいや」と、意識を抜いてしまうと無駄な時間を過ごしてしまうことになるので良し悪しですね。
しかし、speech2textは一般的な言葉でも難しいのに授業・講義で使うような専門用語をちゃんと認識できるのでしょうか?トレーニングするのが大変そうです。
「今日はバターワースフィルタとチェビシェフフィルタを使って規格化フィルタを作っていきたいと思います」
というセリフをいまspeech2textにかけてみました。結果は推して知るべし。教師がはっきり発話すれば、上手く字幕化されるかもしれませんね。逆に、上手く字幕化されるよう教師が発話を意識して、授業が聞きやすくなる効果もありそう。
音声認識率が気になるところ。どの単位で評価するかで、文字・単語・文章での認識率のKPIがありますが、ヒトが見て正しいと感じるのは単語・文章であり、漢字変換の正しさも要求されるので、英語より難易度が高い。
特に、大学の授業で使われる専門用語に、言語モデルがどこまで対応しているか。社内の期初訓示を、今回はコロナの為に
レコーディングとライブ配信で行いました。
社内のチャットでどうでした?と呟いたら、
社員に耳が不自由な人がいるので、我々のAI
技術で、字幕化できませんか?
とあったので、実施したらとても好評でした。
東芝は、音声認識を長年研究しています。
課題はまだ多く有りますが、
声でレポートが書ける、レポートエージェント
を既に実用化しています。
まだまだ課題は有りますが、使って頂くと
技術は進化します。