新着Pick
109Picks
Pick に失敗しました

人気 Picker
通常、話者分離というとマイクロホンアレイを使うのが一般的です。複数のマイクを使って、それぞれのマイクに音が届く時差を利用して複数の話し声を分離します。ただ、空間的にマイク同士を離さないといけないので小型化には向きません。最近は、深層学習を使って分離するという手法も研究されています。

分離したものの、その中の誰にフォーカスを当てればいいかという問題が出てきます。記事の中ではGoogle glassとの関連も述べられているので例えば視線が向いている人の声だけにフォーカスを当てるとかするのでしょうね。

(例として東芝からマイクロホンアレイを使ったもの)
複数の人が同時に話しても話者ごとに発言を聞き分ける分離集音技術を開発-事前に録音しておかなくても正確に聞き分け可能-
https://www.toshiba.co.jp/rdc/detail/1610_03.htm

(例としてNTTから深層学習を使ったもの)
SpeakerBeam: 聞きたい人の声に耳を傾ける
コンピュータ──深層学習に基づく音声の選択的聴取
https://www.ntt.co.jp/journal/1809/files/JN20180912.pdf
人間は、様々な音の中から自分が聴きたいものを聴き分ける能力を持っています。その能力に障害がある「聴覚情報処理障害(APD)」を抱えている方もいます。そんな方には特に役に立つでしょう。
私は人から自分にとって都合の良い話だけ覚えてるとよく言われます。
そのうち脳波とも連携し、自分の聞きたい話だけ聞こえやすくなるようなデバイスができたらメンタルを病む人は減りそうです。
同時に傍若無人な人も増えるでしょうが…
人間は基本周波数が聞こえなくても、倍音成分から基本周波数を知覚できるミッシングファンダメンタルと言う能力を持っていますよね。
(わかりやすい例は電話。人の声は300Hz以下で、電話の音声は300Hz以上しか伝えられないのに、正確に誰の声か判別できる。)

そういった能力をどうやってデバイスに持たせる事ができるか。
この機能、かなりまえに何処かで design competition やってましたねぇ 一瞬やろうかとおもった記憶が もし思い出したらリンクのせときますね

追記
あ、あれだ (スイマセン、ちょっと言えないやつでした)
追記オワリ
「様々な会話が飛び交う複数のグループの中にあって特定の一人の発する声だけに集中したい場合に役立つ、センサー満載のウェアラブル」
なるほど。どういう時に役立つのか自分の日常生活からは想像がつきませんが、探偵さんとかだったら重宝するのかな。
耳で聞こえるものも意識してコントロールできるようになると考えれば凄いですね。
Business Insiderの記事はこちら
[EXCLUSIVE: Inside Google's top-secret project to give you superhuman hearing. Code name: 'Wolverine.']
https://www.businessinsider.com/google-x-alphabet-hearing-project-wolverine-codename-augmented-reality-2021-3
Googleらしい研究。仮に、これがモノにならなくても、基礎的な知見は、他でも役立つ可能性がありますよね。

※個人的な見解であり、所属する会社、組織とは全く関係ありません
周波数でとるのかな?それとも声の飛んできた方向とか距離まで分かる?(ソナーのように)後者だととっても面白い。リアルタイムで音声処理が出来る様になったからこそ実現するんでしょうね。
Facebookも昨年似たようなソリューションを発表していました。
VRは視覚分野が進んでいますが、音声周りの進化も楽しみです。
スパイツールみたい
Alphabet Inc.(アルファベット)は、2015年にGoogle Inc.及びグループ企業の持株会社として設立された、アメリカの多国籍コングロマリットである。 ウィキペディア
時価総額
176 兆円

業績