平成9年11月13日 インターネットのホームページ検索サービス「NTT DIRECTORY」に 検索結果の自動分類機能を試行提供 NTTは、このたび、インターネットのホームページ検索サービス「NTT DIRECTORY」に、 より使いやすく、ホームページ情報を利用者の皆様に提供できるよう、11月14日より 機能追加を行います。 1.概要 NTT DIRECTORYでは、ユーザが自らホームページ情報を登録する登録型のホームページ 検索サービスを補完する目的として、プログラムにより自動的にホームページを収集してく るロボット型の検索サービス(注1)であるTITAN(注2)を提供しています。TITANをは じめとするロボット型検索サービスにおいては、膨大な検索結果をいかに利用者にとって 使いやすいように編集し、表示するかという課題があるといえます。 今回追加する新機能(当社情報通信研究所で開発)は、検索結果を自動的にグループ(ク ラスタ)に分類し、利用者の目的に応じた効率的な検索および検索結果の表示を可能にす ることにより、利用者にとってより使いやすいホームページ検索サービスを実現しまし た。 2.機能の特徴 (1) TITANの検索結果をいくつかのグループ(クラスタ)に自動的に分類し、各グルー プを特徴付ける単語のリストとともに表示します。これにより、利用者はその検索要求に 近いグループを選択して、検索結果を絞り込むことができます。 (2) 検索結果として得られたグループから、さらに小さなグループに絞り込むこ とができる再分類機能を備えています。 (3)自動分類の処理過程において抽出された特徴的な単語のリストを表示します。利用 者はこれらの単語から適当な組合せを選択することにより、さらなる絞り込みを目 的とした検索や、連想的な検索(注3)を実行することができます。 3.利用方法 自動分類機能付きのTITANは、NTT DIRECTORY の TOP画面(http://navi.ntt.co.jp/) または、 http://sting.navi.ntt.co.jp/titan/titan-clx.html よりアクセスできます。 4.今後の展開 今回、NTT DIRECTORYに追加した自動分類機能は現在のところ試行提供ですが、クラスタリ ングの精度・性能や使い勝手に関する評価を試行提供期間中に行い、その結果が良好であ れば本格運用へ移行したいと考えています。その際には、NTT DIRECTORYのトップページか ら直接検索できるようにする予定です。また、単語の頻度分布のみを用いたクラスタリン グには精度面での限界があると考えており、今後はサイト情報を組み合わせたり、NTT DIRECTORYのジャンル体系情報の併用などについて検討していく予定です。 (注1)ロボットと呼ばれる自動プログラムによりWWW上のホームページを予めリンク をたどり網羅的に収集し、これにより得られたデータベースをもとにホームペー ジ検索する機能です。 (注2)当社情報通信研究所が開発したロボット型のホームページ検索サービスで、日本 語のキーワードを英語に自動翻訳することにより全世界のホームページを検索対 象とします。また、ドメイン、ホームページ言語等、検索内容を細かく設定でき、 利用者のニーズにあった検索結果を実現しております。登録ホームページ件数は 53万件。 (注3)利用者の初期の検索要求(キーワード)に対して、何らかの関係を持つキーワード によってさらに検索行うことを意味します。例えば、「花粉症」というキーワー ドで検索を行った後に、システムにより関連語として提示される「アレルギー」 というキーワードを選択して、再検索を行うようなことを指します。
