音声品質評価法

4.音声品質の客観評価法

4.1.プランニングモデル

<プランニングモデルの歴史>
プランニングモデルに関する検討の歴史は古く、80年代前半に様々なモデルがITU-Tに提案されていましたが、国際標準としての一本化には至らず、4つの異なるモデルが併記されるに止まっていました。その後、90年代に提案された「E-model」と呼ばれる新しいプランニングモデルが、ITU-T勧告G.107として標準化されました。E-modelは、NTT提案の「OPINEモデル」の心理尺度値による指標化という考え方をベースとして、AT&T提案の「TRモデル」の「心理尺度値」へのマッピングという方法を取り入れたものです。
E-modelは、欧州のETSI(European Telecommunications Standards Institute)や北米のTIA (Telecommunication Industry Assosiation)においても採用されており、ネットワークプランニングモデルとして広く用いられています。日本国内では、2003年に郵政省令(事業用電気通信設備規則)が改正され、IP電話サービスに対する通話品質基準として、E-modelに基づき算出される品質指標であるR値が用いられています。これに対応し、TTC(情報通信技術委員会)はE-modelをベースとした具体的な通話品質評価法を標準化しました。
E-modelでは、ハンドセットを用いた電話帯域(300-3400 Hz)音声通話を前提としたモデルです。現在では、広帯域(100-7000 Hz)音声通話サービスの登場を鑑み、広帯域音声通話に対応できるようE-modelの対象を拡張させる動きが進んでいます(ITU-T勧告G.107 Appendix IV)。
<E-modelの概要>
E-modelには、端末要因・ネットワーク要因・環境要因などに関する21の入力パラメータがあり、出力指標であるR値はこれらのパラメータの関数として表現されます。E-modelでは、まず「雑音感 (Noisiness)」、「音量感 (Loudness)」、「遅延・エコー感 (Delay and echo)」、「歪・途切れ感 (Distortion)」、及び「利便性要因 (advantage factor)」といった心理要因ごとの評価値を心理尺度上で表現します。そして、これらの値を基準値から加減算することによりR値が算出されます(図参照)。
E-modelのパラメータのうち環境要因や端末要因などは、標準的な特性を想定してデフォルトの値を設定することが一般的です。前述のTTC標準においても評価すべきパラメータを「音声符号化」、「パケット損失」、「遅延」、「エコー」に関連するパラメータに絞り込んでいます。このようにして求められたR値は、標準的な特性を有する端末を標準的な音響環境で用いた場合の通話品質を表現にしているといえます。
具体的なR値計算に用いることが出来るプログラムをITU-Tが公開しています。
(図4.1.1)
(図4.1.1)E-modelとR値
図をクリックすると、拡大図が別ウィンドウで開きます。
<R値と主観品質評価値との関係>
R値と会話MOS値は相関があるといわれており、ITU-T勧告G.107 Annex Bでは両者をマッピングする関係式を提供しています。この式は欧米人の評価傾向に基づいて決められています。一般に日本人の評価値は欧米人に比べて低くなることが知られており、この差分に対応させるために、例えばTTC標準が提供する変換を実施する必要があります。
E-modelは元来、ネットワークや端末の品質パラメータが総合通話品質に与える影響を簡易に指標化するネットワークプランニングモデルとして標準化された計算モデルであり、会話MOS値を正確に推定することは保証されていません。例えば、前頁に示した図では、各劣化要因を単純に減算していますが、2つの要因間の相互作用により単純減算とは異なる傾向を示していることが報告されています。そのため、ITU-Tでは会話品質をより正確に測定する技術の標準化にも取り組んでいます。