
平成8年11月11日
コンピュータの眼で探す
“高速画像探索システム”を開発
−人間の眼に代り、複雑な画像中の目標物を瞬時に探索−
NTTでは、複雑な背景を持つ画像の中から目標とする物体を瞬時に探し出す手法
“高速画像探索システム(アクティブ探索法)”を開発しました。
人混みの中から特定の人物を見つけたり、地図の中から目標物を探し出すという探
索動作は、私たち人間が日常生活の中でしばしば経験することです。しかし、これを
コンピュータで実現するとなるととても人間のようにはいきません。これまで提案さ
れている探索方法は、探そうとする対象の有無を視野全面にわたりくまなくチェック
するという方式が基本となるため、膨大な時間がかかるという問題がありました。
今回開発したアクティブ探索法は、探索の過程で探索対象を含みそうもない領域を
自動的に求め、この領域をスキップ(探索計算を省略)することにより、従来技術の
100〜1000倍の処理速度を実現しました。これらの処理はすべてソフトウェア
により実現しているため、汎用ワークステーションやパソコンでも高速な探索が可能
となります。
本技術は、画像データベース検索や画像診断、物体追跡、監視など幅広い応用が期
待できます。
<開発の背景>
近年の記録媒体の大容量化やネットワーク伝送能力の向上により、膨大な画像デー
タが私たちの身近にあふれています。そのため、これら膨大な画像データ中から興味
ある対象をすばやく探しだす手法の実現が望まれています。また監視システムにおけ
るロボットの目のように、物体を探したり追跡したりといった人間の視覚代行機能に
対する期待も高まっています。
そこで必要となるのが探索対象が画像の中にあるのか否か、そしてあるとすればど
の部分にあるのか、無いならそれに類似したものはあるかといったことをコンピュー
タに判断させる技術です。具体的には探索対象に対応した参照画像と、入力画像の各
部分領域との類似度をコンピュータに計算させ、最大の類似度を持つ部分を探すこと
により、入力画像の中の探索対象の有無とその位置を特定させるのです。
従来は探索対象の見落としがないように、入力画像上で部分領域を数画素(画素:
画像を構成する最小単位)ずつ細かく動かしながら入力画像のすべての部分に対して
類似度計算を行っていました。このため、計算量が膨大になり、処理時間が長くなる
という問題がありました。また、入力画像中の探索対象が拡大・縮小されている場合
も考慮すれば、部分領域の大きさも画素単位で変化させながら調べなくてはなりませ
ん。そのため計算量が爆発的に増え、実用的な時間内での処理が不可能でした。
<技術のポイント>
1.特徴量に色ヒストグラムを採用
アクティブ探索法では、類似度計算の特徴量(何を比べるか)として色ヒストグ
ラム(その画像に含まれる色の割合)を用いています。色ヒストグラムは物体の形
状変化などに影響を受けにくいため、探索対象が多少変形した場合でも探索が可能
です。
2.計算量低減の考え方
アクティブ探索法では参照画像との特徴量の比較を行う際、“入力画像上のある
領域の類似度が低ければ、そこから少しずれた領域の類似度も必ず低い”という考
え方を利用して計算量の低減を行います。
まず、参照画像と入力画像双方の色ヒストグラムを求め、両者の類似度を計算し
ます。この値を目標類似度の初期値として保持しておきます。次に、入力画像上の
ある部分領域の色ヒストグラムを求め、参照画像の色ヒストグラムとの類似度を計
算します。この類似度が目標類似度よりも低ければその差を求めておき、次に類似
度計算を行う場所はその差に相当する分だけスキップした所とします。そしてスキ
ップした先で同様の類似度計算を行って目標類似度との差だけまたスキップすると
いう処理を続けていきます。
もし、ある領域での類似度が目標類似度よりも高ければ、目標類似度をその値に
更新して類似度計算の処理を続けます。
こうすると、類似度が低い所では大きくスキップし、類似度が高い所では小さく
スキップするという動作を繰り返しながら類似度がより高い位置を探していくこと
になります。
これにより、数画素単位ずつずらしながら全画面で類似度計算を行っていた従来
手法に比べ、1/100から1/1000の計算量の低減、つまり100倍から
1000倍の高速処理を実現しました。
3.幅広い応用
物を目で探すという視覚探索の処理は、視野あるいは画像のサイズが大きくなっ
たり、画像の枚数が増えたりすると人間にとっても大きな負担となります。コンピ
ュータにより高速に視覚探索できるアクティブ探索法により次のようなことが可能
となります.
・画像データベースを高速に検索できる
例)カタログの中から特定の花が含まれる写真を瞬時に検索
例)インターネット上の特定の画像対象を検索
・複雑な画像中の目標物を探したり,その数を数えたりできる
例)水槽の中から指定した熱帯魚が何匹いるかをカウント
例)大人数の集合写真から特定の人物を探す
・静止画のみでなく,映像などの動画像にも適用できる
例)映像中の目標物の追跡
例)映像データベースの検索
<今後の予定>
今後もNTTでは、安定性の向上、色情報以外の特徴量への展開などの研究開発を
続け、高度なロボットの視覚、電子図書館における検索、インタースペース内での応
用など、より進んだマルチメディア環境の構築を目指していきます。