News Release


平成11年7月14日

日本電信電話株式会社



2ゾーン分離収音技術を用いて仮想の音響カーテンを実現
─特定のゾーンごとに、狙った音だけをクリアに収音─


 NTTは、音響空間を2つのゾーンに分け、それぞれのゾーンごとに音波をリアルタイムで分離して収音する、音響空間2ゾーン分離収音技術を世界で初めて開発しました。
本技術は、2つのゾーン間を仮想の「音響カーテン」でさえぎることを可能にしたようなもので、どちらかのゾーンの音だけを選択的に収音することができます。

 これまで、空間のあるゾーンの音を収音する場合は、一定方向からの音を主に収音する単一指向性マイクロホンが用いられてきましたが、目的としない音まで収音されてしまうことは避けられませんでした。これに対し本技術では、2ゾーンの音源から生ずる音波が収音用の2本の単一指向性マイクロホンに到達するときの、2チャネル間の信号特性差(到達レベル差と到達時間差)を用いて各ゾーンの音を個別に抽出するので、従来の単一指向性マイクロホンを単独で用いた場合と比較して、分離収音性能を約20dB以上(100倍以上)向上させることが可能となりました。

 本技術を用いれば、1つの音響空間の中に含まれる収音したいゾーン(コミュニケーション・ゾーン)と収音したくないゾーン(プライベート・ゾーン)を完全に分離できます。そのため、マイクロホンを用いた拡声通話を利用するテレビ会議を、専用ルームではなく、一般の部屋で行う場合でも、話者以外の周りの人の声(不要音)を抑圧することが可能となります。(ゾーン収音型会議システム)



 本技術のその他の具体的な利用例としては、以下のものが考えられています。

1)自動車の運転席・助手席別音声指示/制御システム
運転席・助手席それぞれにマイクを設置することにより、運転者、同乗者が同時に自動車の諸機能を制御するコマンドを発声した場合でも、それぞれ別々のコマンドを指示することができます。

2)特定エリア内異常音監視システム
工場・研究所内の特定エリア内にある装置の異常音を検出し、管理室等に通知するシステムが実現できます。


 これ以外にも、将来的には、本技術の活用により、対話形ロボットのような情報機器が話者の位置に応じて聞き分けのできる音声認識システムなどでインテリジェント化され、マンマシンインタフェースが向上することが期待できます。


主な特長


1.単一指向性・超指向性マイクロホンを上回る、優れた分離収音性能(*1

 音(音波)がやってくる方向に対するマイクロホンの感度の違いを指向特性といいます。この指向特性によって、主に無指向性マイクロホン(収音角度は全方向)と、単一指向性マイクロホン(収音角度は前半面)の2つに大別できます。通常のオーディオ録音に使われる単一指向性マイクロホンと本技術を組み合わせた場合、単一指向性マイクロホン単独の状態に比べ20dB以上、また指向性の鋭い超指向性マイクロホン(ガンマイクとも呼ばれます)と比べても約15dB以上という抜群の分離収音性能を発揮します。その結果、収音ゾーンの音量を充分に保ちながら、抑圧ゾーンの音は聞き取れないほど小さく抑圧することが出きます。


2.個別音声認識を実現

 空間内での話者の位置に応じて音を聞き分けることが可能となるため、より正確な音声認識が可能です。例えば、自動車内の運転席と助手席に別々にマイクロホンを設置した場合、かなり狭い音響空間であるにもかかわらず、本技術を導入することで運転席の音声と助手席の音声をほぼ完全に分離して認識できることが、車内騒音なしという条件下で確認されました。


2ゾーン分離収音技術のポイント(図1


 本技術は各マイクロホンへ到達する信号のレベル差・時間差をスペクトル(*2)領域で算出し、これらを元に、各ゾーンにある音源の周波数成分を判定し、抽出します。この際、周波数の各スペクトルごとに音源が判定・抽出されるため、分離性能に優れています。なお、本技術はパーソナル・コンピュータに内蔵されたDSP(*3)ボードによって、リアルタイム処理が可能です。なお原理的には、マイクロホンの設置方法によって、2ゾーンに限らず、さまざまな分離ゾーンを実現することができ、現在検討を進めています(たとえば、3本のマイクロホンの間隔を120度の角度にたもって設置すれば、分離ゾーンは3つになります)。


用語解説

1.分離収音性能

抑圧ゾーンの音の大きさに比べて、収音ゾーンの音の大きさを何dB(何倍)大きく収音でき る、という数値性能です。

2.スペクトル(spectrum)

信号を周波数成分ごとに分離したときの強度分布のことです。音の場合、振動数ごとの成分に分解し、それぞれの成分の音圧またはエネルギーをその振動数について表示したものになります。

3.DSP(digital signal processor)

ディジタル信号処理をおこなう集積回路のことで、音声信号のほか、ビデオ信号などの合成処 理、フィルタリング処理に用いられます。



別紙
図1 2ゾーン分離収音技術
図2 2ゾーン分離収音技術の基本構成




<本件に関する問い合わせ先>

NTTサイバーコミュニケーション総合研究所
 情報戦略担当 川嶋・坂本
 TEL:0468-59-2032
 e-mail:ckoho@tamail.rdc.ntt.co.jp



News Release Mark
NTT NEWS RELEASE