音声・音響処理技術

技術領域
先端技術

印刷用PDF (553KB)


概要

臨場感のある快適なコミュニケーション環境の実現に向け、目の前に相手がいるかのような立体音像のための収音再生技術や、通信を阻害するようなエコーを消し去るエコーキャンセラ技術、回線速度に応じて高品質な音声通信を確立するための音声符号化技術などの研究開発を行っています。

従来の固定電話相当の音声品質から、さらに高音質・高機能な音声通信サービスを実現するためには、回線速度と再生環境の多様化に対応することや、受話器を用いずに、スピーカーとマイクを用いたハンズフリー拡声通話を行うことが望まれています。

広帯域スケーラブル符号化(図1)とは、アナログ電話相当の狭帯域音声だけでなく、広帯域音声も同一方式で符号化する方式です。従来の音声符号化方式では、多地点間を結ぶ通信を行う際には、全対地が最も速度が遅い回線に通信速度を合わせなくてはならなかったのですが、広帯域スケーラブル符号化を使えば、フレッツ光ネクストなどのブロードバンド回線同士の通信は、7kHz帯域の広帯域音声で、ブロードバンド回線とアナログ電話網との通信は、狭帯域音声で多地点通信を行うことが可能となります。NTTが提案した方式に基づいた広帯域スケーラブル音声符号化方式は、他国4機関との連携により、2008年3月にITU-T国際標準G.711.1として勧告が成立しました。さらに、2010年11月には、14kHz帯域まで拡張可能なG.711.1 Annex Dの勧告が、ITU-T国際標準として成立しました。

一方、拡声通話時には、スピーカーからマイクに回り込むエコーやハウリング、さらにマイクに入る周囲雑音などが問題になりますが、これらの解決とステレオの音像をより強調するのが、音像定位強調機能付き音響エコー・ノイズキャンセラ技術です(図2)。この技術は通信会議装置、あるいは通信会議ソフトに組み込まれ、エコー・ハウリング・ノイズを消去し、CD帯域のステレオ音声だけを相手に送ることで、快適な拡声通話を実現します。


図版