ページの先頭です。
コンテンツエリアはここからです。

NTT持株会社ニュースリリース

2014年4月16日

世界初、約20m先にいる任意の人の声をクリアに収音できる技術を開発

日本電信電話株式会社(本社:東京都千代田区、代表取締役社長:鵜浦博夫、以下NTT)は、カメラでズームして撮影するように、遠く離れた場所(約20m)で話す人々の声から、指定した人の声のみをクリアに収音可能な「ズームアップマイク」を開発いたしました。本技術を活用することで、今後、例えば、スポーツ観戦や中継において、まるでカメラでズームするかのように、遠く離れた選手の声を自由に選んで聞くことが可能となります。

これまで、遠くの音を収音する技術には、ガンマイクやパラボラマイクなどがありましたが、音源が5m以上離れた位置にある場合、受音時のエネルギーが小さいことや空間分解能が低いため、周りの雑音と区別して収音することが困難でした。

今回開発した「ズームアップマイク」は、約100本のマイクロホンと、凹型反射板から構成されています。音を反射させて遠くの音を収音可能とする凹型反射板の前に、約100本のマイクロホンを設置することで、そのマイクロホン間に生じる位相/振幅差を利用し、遠く離れた場所(約20m)の狙った音だけをクリアに収音することを可能とします。また、約100本のマイクロホンから、すべての音声を録音しておくことで、あとから任意の場所の音をズームアップして聞くことも可能です。

今後、利用シーンとしては、例えば、望遠カメラを組み合わせることで、スポーツ選手に映像も音声もズームアップし、より臨場感のあるスポーツ観戦や放送サービスが可能となります。また、大きな会場の客席からの質疑応答も、手元にマイクなしでクリアに聞くことが可能となるほか、大人数のテレビ会議でも一人一人の発言をクリアに聞くことができるようになるなど、様々な用途への応用が期待されます。

今回開発した「ズームアップマイク」今回開発した「ズームアップマイク」

1.今後の展開

展開イメージ1:大型施設への音響ソリューション

 望遠カメラを組み合わせることで、スポーツ選手に映像も音声もズームアップし、より臨場感のあるスポーツ観戦や放送サービスを可能となります。今後、NTTでは、スポーツ中継における収音方法の一つとして、スタジアムへの設置を目指します。その際、雑音や風に対する耐性を備えるために、実証実験を通じて技術レベルのさらなる向上を図ってまいります。

展開イメージ1:大型施設への音響ソリューション

展開イメージ2:小型汎用性のある収音装置・ソリューション

 NTTでは、小型で汎用性のあるマイク素子(2〜3本)と今回開発した信号処理技術を組み合わせることで、騒音や雑音のある環境下でも、クリアに狙った場所の音声を収音できる小型収音装置(マイク)やソリューションを、NTTグループの事業会社を通じて、開発・販売してまいります。
 これらを活用することで、例えば、雑音の多い車でのカーナビ操作や、工場内での機械騒音下でのハンズフリー会話などへの活用が期待できます。

展開イメージ2:小型汎用性のある収音装置・ソリューション

2.開発の背景

 NTTは、カメラで遠方を撮影するように、遠方にある音をクリアに収音することを目指し研究しています。
 例えば、遠くにある音をクリアに収音できるようになれば、コート内にいる選手の声や応援している人の声を選別して聞くことができます。メディア処理技術が進歩すると、将来的には、あたかもユーザーがグランドやコート内にいるかのような映像/音声の視聴が体験できる日が来るかもしれません。

 これまで、遠くの音を収音する技術としては、ガンマイクやパラボラマイクがありました。これらの空間分解能は、20〜30度程度であり、5m以上離れた隣り合った人の声を聞き分けて収音することはできませんでした。
 また、2〜4本程度のマイクロホンを用いたマイクロホンアレイは、遠隔会議用システム、スマートフォン、ゲーム機のメディア入力装置といった用途で商用化されています。これは、複数のマイクロホン間に生じる位相/振幅差を利用することで、ユーザーが選択した任意の方向にある音を強調することが可能になります。しかし、受音時の信号対雑音比(SN比)が低いことや、空間分解能が30度程度であることから、遠くの音をクリアに収音するといった用途に適用することは困難でした。

 音響分野の研究発表では、遠くの音をクリアに収音するという技術は実現困難な技術とされていて、世界的に見ても、NTTが開発した「ズームアップマイク」はオンリーワンの研究成果となります。

方式 特徴 距離
(空間分解能から算出)
(ⅰ)ガンマイク
(ⅰ)ガンマイク
  • 可搬性に優れており、放送用途で使用される。
  • 短い距離では、指向性が鋭い。
3m
角度分解能:
約30度
(ⅱ)パラボラマイク
(ⅱ)パラボラマイク
  • 広範囲の音をパラボラ反射板でかき集めて収音するため、野鳥のさえずりのような小さな音を収音できる。
6m
角度分解能:
約20度
(ⅲ)マイクアレー
(ⅲ)マイクアレー
  • 複数のマイクロホンを用いることで、信号処理によって収音する方向を自在に操作できる。
3m
角度分解能:
約30度

3.技術のポイント

 NTTメディアインテリジェンス研究所が開発した「ズームアップマイク」は、“遠くにある狙った音をクリアに収音するためにどのような信号を受音すべきなのか”について、情報理論に則って基本原理を構築しました。

技術ポイント1:情報伝送量を最大化するための受音系設計技術

 構築した原理に則って、凹型反射板の前に、100本程度のマイクロホンを準最適に配置するための受音系設計技術を開発しました。開発した受音系では、それぞれのマイクロホンができるだけ異なる性質を持つ信号を受音することで、狙った音源とその他の雑音を区別するための手掛かりを得られるようになりました。
 受音した100個の信号をパソコンに取り込み、リアルタイムで信号処理することで受聴するための信号を出力します。

技術ポイント2:任意の場所にある音源を強調可能にするフィルタ生成技術

 ズームアップマイク技術で採用した信号処理技術の特徴として、ユーザーが選択した任意の場所にある音源を収音できるようになりました。あらかじめ、無響室内で収録した計測データから膨大なフィルタ群(約2300パターン)を生成し、パソコンのメモリ内に展開します。ユーザーが選択した任意の場所に対応したフィルタを観測信号に瞬時に適用することで、狙った音を強調して収音できるようになりました。

技術ポイント3:残留雑音のレベルを1/1000まで低減する空間探査型雑音抑圧技術

 受聴信号に含まれる残留雑音のレベルを約1/1000まで抑圧し、よりクリアに聞き取り易い信号出力を可能にしました。複数のフィルタを用いて空間全体を探査し、様々な性質を持つ雑音の受音レベルを推定します。ターゲット音とのレベル比に応じたポストフィルタを設計することで、環境に対して頑健に雑音抑圧することが可能になりました。
 これら3技術の組み合わせにより、空間分解能「3度」(20m離れた位置で隣り合っている人の声を分離可能)を達成しました。

 NTTでは、20m先にある音源に対する動作検証は行っておりますが、今後、20m以上の距離にある音源に対する収音能力に対する検証作業を進めてまいります。NTTでは、2年後を目安として、50m(サッカーコートの長辺の半分)先にある音源をクリアに収音できるように、技術レベルを向上してまいります。

技術ポイント3:残留雑音のレベルを1/1000まで低減する空間探査型雑音抑圧技術

本件に関するお問い合わせ先

日本電信電話株式会社

サービスイノベーション総合研究所
企画部広報担当
TEL: 046-859-2032
E-mail: randd@lab.ntt.co.jp

Innovative R&D by NTT
NTTのR&D活動を「ロゴ」として表現しました

ニュースリリースに記載している情報は、発表日時点のものです。現時点では、発表日時点での情報と異なる場合がありますので、あらかじめご了承いただくとともに、ご注意をお願いいたします。

NTT持株会社ニュースリリース インデックスへ

サブコンテンツエリアはここからです。
  • NTT持株会社ニュースリリース内検索

 年   月 〜
 年   月 

  • NTT持株会社ニュースリリース
  • 最新ニュースリリース
  • バックナンバー
  • English is Here
  • NTT広報室 on twitter NTTグループの旬な情報をチェック!
  • Facebook NTTグループ 公式フェイスブックページ(別ウインドウが開きます)
フッタエリアはここからです。