News Release


平成11年2月24日

日本電信電話株式会社



AMFにおける多言語によるインターネット情報検索共同研究プロジェクトの開始について
−インターネット利用における言語の壁の克服を目指して−


 NTTは、アジア地域のマルチメディア・サービスと技術の発展への貢献等を目的にアジア地域の主要な情報通信事業者等により1997年6月に設立されたアジア・マルチメディア・フォーラム(AMF(*1)に設立時より参画、ATM、衛星、インターネットの3つの国際的テストベッドを構築し、さまざまなマルチメディア利用トライアルを展開しています。

 この度、トライアルの一環として、NTT、韓国科学技術院(KAIST(*2):韓国)ケントリッジデジタル研究所(KRDL(*3):シンガポール)の三者は、各国のWWWページなど多様な言語で書かれたインターネット上の情報を母国語で一括して検索するための新しい仕組み「多言語分散情報検索」に関する共同研究プロジェクトを開始しました。


 本プロジェクトは、参加各メンバーがそれぞれ日本語、中国語、韓国語用に開発した検索エンジン(*4)および言語翻訳等の自然言語処理機能をインターネット上で結び、それらの協調によって各言語のWWW情報を一つの言語でまとめて検索できる仕組みを開発することを目指しています。


 この仕組みは、「多言語分散情報検索アーキテクチャ」とよばれ、インターネット上に配置された複数の「検索サイト」と「メタサーチエンジン」とよばれるソフトウエアからなります。

 検索サイトは、従来の検索エンジンと同様に、ある言語(例えば日本語)で与えられた検索語句と同一の言語あるいは少数の異なる言語(たとえば英語)のWWWページを検索する機能を持ち、メタサーチエンジンは、利用者の要求に合う検索サイトの選択や、利用者の検索語句の翻訳など、検索サイトと利用者とを仲介する機能を持ちます。

 例えば日本語の検索語句で日、中、韓の各言語のWWW情報を検索する場合、メタサーチエンジンは、まずこれらの言語で書かれたWWW情報を持つ検索サイトを選び、検索語句をこれらのサイトで扱うことのできる言語に翻訳して検索を依頼(別紙参照)、検索結果をまとめて表示します。


 本プロジェクトで開発する多言語分散情報検索アーキテクチャの大きな特徴は、メタサーチエンジンと検索サイトが情報のやり取りを行なう際に、今回新たに作成する「多言語分散情報検索プロトコル」という共通の手順を用いることです。このプロトコルの利用によって、別々に開発された検索サイトやメタサーチエンジンなどを自由に組み合わせて新たな言語や分野への拡張を容易に行うことが可能となり、具体的には、様々な言語でキャプションの付いた写真や音楽などのマルチメディア情報を一括検索する、といったことができるようになります。


 既に多言語分散情報検索プロトコルの原案を策定し、現在、NTT、KAIST、KRDLがそれぞれ日本語、韓国語、中国語に対して英語との間の多言語検索が可能なメタサーチエンジンと検索サイトの構築を進めています。NTTは、サイバースペース研究所の開発したインターネット多言語情報検索システム(TITAN(*5)をベースにサイト構築を行っています。

 本年3月には相互接続実験を開始し、早ければ6月よりインターネット上での一般公開実験を開始する予定です。また、プロトコルの仕様についても、普及促進に向けてインターネット上での公開を予定しています。


 なお、明日25日及び26日に韓国済州島で開催される第6回AMF総会において、本システムの一部についてデモが行われます。

用語解説
*1 AMF (The Asian Multimedia Forum)
NTTがアジア地域の通信事業者等16社とともに1997年6月に設立した民間の企業・団体によるオープンなフォーラムで、アジア・太平洋地域におけるマルチメディア・アプリケーション及びサービスの共同開発、利用促進、プラットフォーム構築を目指している。1999年1月現在、会員企業・団体は50を超える。URL:http://www.asiamf.org

*2 KAIST (Korea Advanced Institute of Science and Technology)
韓国科学技術省(Ministry of Science and Technology)傘下の研究教育機関。
URL:http://www.kaist.ac.kr/

*3 KRDL(Kent Ridge Digital Labs)
シンガポール国家科学技術委員会(National Science and Technology Board)傘下の研究開発機関。
URL:http://www.krdl.org.sg/

*4 検索エンジン
インターネット上の情報資源(WWWページなど)をあらかじめ網羅的に収集しこれらの中から与えられた語句に関係するものを検索するサービス、または、ソフトウエア。

*5 TITAN
外国語(たとえば英語)で書かれたインターネット上の文書を一つの言語(たとえば日本語)で検索するシステム。試験サービスのURLはhttp://titan.mcnet.ne.jp/
別紙
多言語分散情報検索アーキテクチャの概念図

参考
AMF会員企業一覧(1999年2月24日現在)





<本件に関する問い合わせ先>
長距離国際会社移行本部広報室
大久保、稲次
TEL 03-3500-8020

同 国際事業部
佐野
TEL 03-5353-2901



News Release Mark
NTT NEWS RELEASE