日本電信電話株式会社(以下NTT、本社:東京都千代田区、代表取締役社長:三浦惺)は、最新の映像符号化国際標準方式MPEG-4 AVC(Advanced Video Coding)/H.264の拡張規格であるSVC(Scalable Video Coding)に準拠したコーデック(エンコーダ・デコーダ)を開発しました。本エンコーダ・デコーダはソフトウェアで構成されており、フルHDTVからモバイルまでの様々な解像度映像を1つの圧縮データで再生できるスケーラブル映像圧縮※1という機能を実現します。エンコーダによる圧縮データの生成と、デコーダによる複数解像度映像の再生を、ともにリアルタイムで処理することが可能です。これらの機能をフルHDの解像度で実現したのは世界初です。 |
1.開発の背景 |
 | 映像を取り巻く環境は大きく変化しています。一般家庭のリビングにおいては、大画面テレビの普及などによりフルHD映像(1920画素×1080ライン)を視聴できるようになってきています。一方、モバイル環境においては携帯端末の処理能力向上、ディスクの大容量化、無線ネットワークの高速化などにより、好みの映像を持ち運んでいつでもどこでも視聴できるようになってきており、映像を視聴する環境の多様化が進んでいます。
映像はもともとデータ量が膨大であるため、効率的に伝送・蓄積するためには圧縮処理が必要です。その際、多様化する視聴環境に合わせて、同一の映像コンテンツを色々な解像度で圧縮したり再生したりしたいという要求が増えています。そのような要求に対して、従来は異なる解像度毎に、それぞれ独立した圧縮処理を行っていたため、複数の圧縮データが存在してしまい非効率でした(図1上 サイマルキャスト)。それに対して、スケーラブル映像圧縮では、1つの圧縮データから異なる複数の解像度の映像を再生することが可能です(図1下)。
この技術を用いるとサイマルキャストに比べてデータ量を10〜30%程度減らすことができるため、ネットワーク帯域やディスク容量を有効に利用できます。
スケーラブル映像圧縮の国際標準方式としてSVC(Scalable Video Coding)が2007年に規格化されました。SVCはMPEG-4 AVC/H.264の拡張規格であり圧縮効率が高いという特徴を持っていますが、半面、圧縮処理のための演算量が膨大になりやすいという短所があります。そこで、フルHDのような高解像映像をリアルタイム圧縮処理するためには、画質を落とすことなく演算量を効果的に削減することが重要なポイントとなります。 |
2.開発した技術の概要 |
 | (1)階層構造を利用した高速モード選択(図2) |
|  | スケーラブル映像圧縮では圧縮処理を階層的に行います。まず最下位階層の圧縮処理を行い、次に上位階層に向かって階層毎に圧縮処理を行います。その際、下位階層と上位階層で同じ位置となる領域では圧縮処理のために必要な情報に相関があるため、下位階層で得られた情報を上位階層で効果的に利用することにより多数ある圧縮方法(モード)の候補を限定します。これらの処理を行うことにより、全ての処理を行う場合に比べて演算量を5%程度に削減しています。 |
 | (2)階層ストライプ並列エンコーディング(図3) |
|  | マルチコアCPUの性能を十分に発揮しつつ、上述の「階層構造を利用した高速モード選択」を効率的に実現するため、階層ストライプ並列エンコーディング技術を開発しました。この技術では画面の処理領域をコア毎に割り当てますが、その際に各々のコアで処理する画面領域を全ての階層で同一とすることにより、下位階層の情報を上位階層で効率よく利用できるようにしました。これにより市販のパソコンでリアルタイム処理することを実現しました。 |
3.今後の予定 |
 | 今後は、コンテンツ流通やコミュニケーションサービス等、事業への適用に向けた検討を行っていくとともに、フルHDを超える高解像度映像への対応についても検討していく予定です。
なお本技術は、4月に米国ラスベガスで開催されるNAB2009に出展する予定です。 |
(用語解説・補足) |
 |
| ※1 |
スケーラブル映像圧縮とは、1つの圧縮データから異なる複数の解像度やビットレートの圧縮データを取り出すことができる圧縮方式です。(図4) |
|