【必見】LINEの「文字起こし」ツールの精度がすごい
コメント
注目のコメント
自分もライターという職業柄、一月に10本前後のインタビューデータの文字起こしが発生します。
以前、AI文字起こしを試してみましたが、精度が悪くて使い物になりませんでした。ところが数ヶ月前、あるAI文字起こしアプリの精度がすごく高いことに気づき、有料ではありますが今ではすべての起こしをそのアプリで対応しています。録音状況がよければ、起こし間違いは5%くらいに収まるイメージです。
他のライターさんたちも、AI文字起こしの精度がここ数ヶ月で飛躍的に上がったと言っていたので、何か技術的進歩があったのだろうと思っていましたが、背景にはこういう技術があったのですね。
LINEの「CLOVA Note」も、試してみます〜AIはアルゴリズムと同様に大量の学習データが肝だと思いますが、Wikipediaとかを使うただのテキストと違って、「音声データとその書き起こし」が同時に並ぶ学習データってネットに転がっているわけではないですよね。それを痛感しました。そして、人海戦術。
英語の文字起こしは進んでいるというお話もありましたが、英語の学会では「Otter」というのを使っていました。
https://otter.ai/
めちゃくちゃ精度もよく、(ぼくはまだ使ったことはないですが)zoomなどのオンラインでも使いやすいようになっているみたいです。ずっと文字起こしさせておくとリスニング苦手な人にとっては少し気が楽になる気もしますよね!情報系の学生です。
自然言語処理系の授業がありますが、End-to-Endモデルは非常に画期的な技術だと思います。
今まではそれぞれの処理を別々のモデルでやらなくてはならないですが、これを使うと一貫したモデルで処理できます。
NewsPicksの記事も対談形式が多いので、CLOVA Noteで作成した記事などがでてきても面白いかなと思います。