News Release

2004年10月25日
日本電信電話株式会社


標準テレビ品質の映像をリアルタイムに処理可能な
スケーラブル映像ソフトウェアCODECを開発
〜ユーザが受信帯域や視聴領域を自由に指定できる多地点通信会議システムを実現〜


 日本電信電話株式会社(以下NTT、本社:東京都千代田区、代表取締役社長:和田紀夫)は、標準テレビ品質(VGA*1, 30fps*2)の映像をリアルタイムに処理可能なスケーラブル*3映像ソフトウエアCODEC*4を開発しました。従来のスケーラブルCODEC技術*5と比較して約4倍の解像度の画像を高価な専用ハードウェアを必要とせず、リアルタイムでの処理を可能としました。
 また、本CODECを適用したサーバ・クライアント型の多地点通信会議システムを開発し、ネットワークの帯域や端末の能力に応じた任意の品質の映像視聴に加えて、クライアント単位の要求により、映像の一部の注視領域(以下ROI: Region Of Interest)の画質を高め、他の領域の画質は、相対的に抑えた符号化データを高速に取り出すことを可能としました。これにより、視聴者が画面の中で特に鮮明に見たい部分をより高画質に視聴可能となります。また、各クライアントのネットワーク帯域やROIに対する要求を高速に処理できるため、1台のサーバで同時に数十人が接続可能です。
 本技術の適用により、従来、一律の帯域でしか視聴ができなかった多地点通信会議に、個々のユーザからのネットワーク帯域やROIへのニーズを反映することが可能になります。また、帯域の違う様々な通信環境で同一の映像を複数のユーザで共有する遠隔教育システムや遠隔監視システムへの展開など幅広い分野での利用が期待されます。


【開発の経緯】
 NTTサイバースペース研究所では、従来からPCをクライアントとしたコンテンツ配信や双方向コミュニケーションサービスに向けて、MPEG-4 ASP *6によるソフトウェアCODECを開発してきました。しかし、MPEG-4 ASPは、非スケーラブルな符号化データであるため、符号化時の帯域よりも通信ネットワークの帯域が狭い場合は送信することができませんでした。また、多地点通信会議に非スケーラブル符号化を提供した場合、一番細いネットワークでも通信ができるように符号化データ量を落とさなくてはいけないという問題がありました。様々な通信環境での高品質・多人数での映像コミュニケーションを実現・普及するためには、スケーラブル性をもった符号化データを生成・解凍するCODECとスケーラブル符号化データを効果的に扱うためのサーバ技術を開発する必要がありました。


【技術のポイント】
1. 画質、画像サイズのスケーラビリティを備えたリアルタイムCODEC(別紙1
 スケーラブル映像符号化とは、符号化データから複数の品質の映像を取り出せる符号化方式です。一般的にスケーラブル符号化データは、基本レイヤと拡張レイヤという2層構成となっており、基本レイヤは、最低品質の映像を保証するデータ、拡張レイヤは、付加価値をつけるデータから構成されています。具体的に拡張レイヤには、画質を向上させるデータ、画像サイズを高めるデータ、フレーム数を高めるデータを付加することができます。
 本CODECは、標準スケーラブル符号化方式であるMPEG-4 ASP/FGS*7に準拠し、原画像を縮小・拡大する処理を加えることによって、2種類のサイズの画像を取り出すことを可能としました。さらに、キャシュメモリにのせるデータ量の最適化などを行ったことにより、これまでの約4倍の解像度である標準テレビ品質映像のリアルタイム符号化・復号を可能としました。これにより、一つの符号化データから様々な品質の映像を取り出すことが可能になりました。
2. スケーラブル符号化データを高速に処理可能な多地点通信会議サーバ(別紙23
 一つの符号化データから任意の大きさの符号化データを取り出す技術を開発し、高速に所望の品質の映像を取り出すことを可能にしました。さらに、任意の符号化データに対してROI部分に優先して符号量を割り当てる技術を開発し、全体の符号化量を変更することなく、注目している領域を高精細化し、その他の領域の画質を抑えた符号化データを高速に作り出すことを可能にしました。また、各クライアントからの帯域やROIの要求に応じてスケーラブル符号化データをサーバで高速に処理できるため、1台のサーバに対して数十クライアントの同時接続を可能としました。


【今後の予定】
 今後は、本格化するIP網を介した映像通信サービスの基盤技術として、本CODECを組み込み、ネットワークや端末の能力に柔軟に対応する映像通信サービスを、NTTグループ各社と連携して提供していくとともに、更なる発展を目的にMPEG-4 ASPより圧縮効率の高い H.264/ MPEG-4 AVC*8を利用したスケーラブルCODECの実現・検討を進めます。
 また、本CODECを利用して、情報通信研究機構委託研究開発テーマ「通信ネットワーク利用放送技術」における、1000万人放送向けのスケーラブル映像配信サーバの検討を進めます。
 最後に、本技術の一部については、10月25日から10月27日までサンフランシスコ(米国)で開催される‘CTIA WIRELESS I.T. & Entertainment 2004’にて、NTTコミュニケーションズ株式会社(本社:東京都千代田区、代表取締役社長:鈴木 正誠)提供の「リアルタイム双方向映像通信システム」に組み込み展示される予定です。



[用語解説]
*1: VGA(Video Graphics Array)
IBM社が開発し、同社のパソコンPS/2に組み込んだグラフィックシステム。640_480ドット、16色の表示が可能。PC用グラフィックシステムの標準として広く普及した。BIOSにより直接制御されているため、VGAの後継として多くの高解像度システムが開発され普及した現在でも、デフォルトのグラフィックモードや、グラフィックシステムにトラブルが発生した場合の緊急用モードとして利用されている。単純に640×480画素の解像度を示すこともある。
*2: fps(Frame Per Second)
動画のなめらかさを表す指標。1秒間に何枚の画像を表示しているかを示す。
*3: スケーラブル
システム規模の大小にかかわらず幅広く適用させることができる。今回の場合、帯域の大きさ、端末の処理能力などに合わせた映像データを柔軟に送受信可能とする。
*4: CODEC(COder and DECoder)
映像や音声データを所定のストリームに圧縮するエンコーダ(Coder)と、逆に圧縮されたストリームから映像や音声データに伸張するデコーダ(Decoder)の、両方の機能を有するもの。デジタルの映像や音声はデータ量が膨大となるため、適切なCODECを用いてデータを圧縮することが大切である。
*5: 従来では、CIFサイズ(画像サイズ)で実現。これを用いたシステムをNTT-Comより、2004.3.3発表済。
http://www.ntt.com/release/2004NEWS/0003/0303.html
*6: MPEG-4 ASP(Moving Picture Experts Group phase 4 Advance Simple Profile)
映像データの圧縮方式の一つで、MPEG規格のひとつ。
*7: ASP/FGS(Advance Simple Profile, Fine Granularity Scalable Profile)
ASPは、シンプルプロファイルの帯域を拡張したもの、FGS は、スケーラブル性を持たせるための符号化技術である。
*8: H.264/ MPEG-4 AVC
ITUおよびISOで標準化された次世代高圧縮映像符号化方式。地上波デジタルの移動体向け放送や次世代DVD企画に採用が決まっている。



別紙1 スケーラビリティを備えたリアルタイムCODEC
別紙2 高速に処理可能な多地点通信会議サーバ
別紙3 ROIスケーラビリティ利用イメージ
(参考) スケーラブル遠隔教育例




[本件に関する問合せ先]

NTTサイバーコミュニケーション総合研究所
企画部広報担当 定方/山下
Tel:046-859-2032
E-mail:ckoho@lab.ntt.co.jp


NTT ニュースリリース

Copyright(c) 2004 日本電信電話株式会社