ページの先頭です。
コンテンツエリアはここからです。

研究開発マガジン[キーワードでわかる先端技術:vol.7]「評判分析」Web上にあふれる評判情報を蓄積し、評価ポイントと時系列で分析・表示

例えば、お気に入りの俳優やアーティストの新作映画や新譜CD、あるいは気になる商品やサービスの評価を知りたい場合、マスコミの記事やメーカーが発信する広告だけでなく、ファンや実際のユーザの声を聞きたいと思う人は多いのではないだろうか・・・。

今、Web上にはそんなクチコミ情報があふれている。しかし、評価サイトやブログサイトはそれこそ無数にあり、確かな評価を探るためには、多くのサイトをひとつひとつ検索しなければならない。そこで、さまざまな評価記述を集積・分析する評判情報インデクシング技術が、知りたいクチコミ情報を一望できる新たなポータルサービスを実現させた。

クチコミ情報が一望できるサービスを生み出したい

「いまやインターネットユーザの多くが、何らかのかたちで検索サービスを活用しています。気になる人物や商品の情報を得ようとする時、広報資料やスペック情報だけでなく『他者の評価はどうなのか』を知りたいはずです。しかし、従来の文書検索はキーワードにかかわる単語単位での一致か、類義語を含む文書の抽出しかできず、評判情報を効率的に収集することができませんでした。そこで、Web上に広がる評価の記述を集計してデータベースを形成し、さまざまな切り口による評判を知ることができる仕組みを築きたいと考えたのです」
そう語るのは、NTTサイバースペース研究所・音声言語メディア処理プロジェクト 音声・言語基盤技術グループ主任研究員・浅野久子だ。

goo評判分析浅野は、知りたい対象に対してブログ上に書かれたクチコミを一望できる仕組みを構築した。例えば、携帯電話端末の場合なら、気になる機種名を入力して検索すると、画面左側に「デザイン、画面、機能、カメラ」など、その機種がどのような観点で語られているかを表す「評価ポイント」を記述数の多い順に表示。各ポイント項目をクリックすると、その評価にかかわる実際の文言(ブログ記事からの抜粋)を見ることができる。さらに同一画面上に、書き込み数の時系列変化をグラフで表示し、週単位で代表的な発言要旨を吹き出しのようなタグ(タグ・クラウド)で表示する仕組みである。

2007年5月には、NTTレゾナントの『goo評判分析』(http://blog.search.goo.ne.jp/wpa/guide/)として、この仕組みを利用したサービスが開始された。以来、バージョンアップを重ねながら、多くの人たちに活用されている。

求める評判情報を自動的に収集して知識化

評判データベースを構築するためには、高頻度なブログ情報の収集が必要だ。さらに、日々増え続けるブログを処理するためには、高速性も求められる。ブログや掲示板などのCGM(Consumer Generated Media:消費者生成メディア)は、記述に関する定型的なフォーマットやルールがあるわけではない。一般の方がそれぞれの言葉で自由に評価を書き込むので、Web上の大量のテキストデータから求める情報を的確に抽出することはそれほど容易ではない。そこでNTTが開発した大規模な意味辞書に基づいて、意味の解析と評判情報の抽出を行うための「評判情報インデクシング技術」がパワーを発揮する。

「この技術は、NTTが開発した大規模な意味辞書に基づいてテキストを解析して、評価するポイントにしたがって評判情報を抽出するもので、『何の(評価対象)』、『どこが(評価ポイント)』、『どうであるか(評価表現)』を大規模なブログの中から自動的に抽出してインデクス化してくれます」(浅野)

つまり各文書に対して、評価対象、評価ポイント、評価表現という3つ組を抽出することによって、検索対象となる文書を単なる単語の集合としてではなく、文書全体を「意味を有したデータ」として扱うことができる。この結果、検索サービスを利用するユーザが知りたい評判を、評価ポイント単位や時系列などで集計することが可能となり、人名や商品名、店名など、求めるキーワードに対するWeb上の評判情報を、高速かつ高精度で抽出して提示するのだ。

図1 評判情報インデクシング技術の概要

日本語の特性や構造を熟知した視点で分析手法を構築

さらに、本サービスの実用化には日本語固有の問題への深い取り組みが必要だった。日本語は、単語ごとにスペースを設ける英語や仏語などと違って、単語同士を分かたずに続けて記述する。どこで単語を切るのかを判断するために、詳細な文法知識を素にした形態素解析が求められる。NTTが開発した解析エンジンは、90万語の大規模辞書を備え、ネットワーク上の大量のブログを遅延なく処理できる高速性を持っている。

さらに、複雑で省略が多く、また、複数の話題が混在する日本語ブログ文章の中で「その文章が何についての評価を記述しているのか」を判別するために、文の主語と述語の関係や単語間の修飾関係などを解析する係り受け解析に加えて、省略の解析、話題の変わり目の推定などの処理を組み合わせた方法を新たに開発。「何に対するどんな評価なのか」を抽出することが可能になった。

図2 評判情報抽出処理
「また、Webへの書き込みに多く見られる話し言葉やくだけた表現、あるいは新語やスラング、表記の揺れなどについても、常に辞書の更新を図って対応力を高める努力を払っています。現在、携帯絵文字にも対応できるように拡張を進めていますが、これらを含めてさらなる進化を図っていきたいですね」(浅野)

今後のマーケティング活用や裾野拡大への期待

『goo評判分析』は、「goo」のブログ検索の結果画面の上に表示される「評判を調べる」をクリックすると、検索したキーワードの分析結果を見ることができる。このサービスは、書籍、映画、音楽、商品などに対するユーザの知りたい評価ニーズに応じたさまざまな吟味・検討を支援している。クチコミ情報の評判推移を【分析する】のほか、競合商品や類似するキーワードを任意に選び、グラフで比較して検討することができる【比較する】、さらに対象商品のジャンルや商品に関連する話題や言葉を探すことができる【関連語をさがす】という検索ボタンが設けられている。
日経エンタ総研
他にも「goo」のブログ評判分析機能が利用されているものとして、日経BP社のバーチャルな研究機関『日経エンタ総研』http://trendy.nikkeibp.co.jp/article/column/20071019/1003549/がある。ここでは現在流行しているいくつかの言葉に対して、ブログ上での評価をグラフで一覧できるとともに、記者による分析記事も読むことが可能だ。

このように、評判情報検索サービスは市場の生の声や反応の大きさが時系列で把握できるので、パイロット的な先行施策の評価や本番適応への方向確認や軌道修正、戦略策定支援、あるいは広告展開やキャンペーンなどの販促イベントに対する効果測定ツールとしての活用も期待できる。

「この分析機能によって、特定の商品やサービスについて評価ポイントとその中身が頻度順に判明します。さらに、書き込み推移が時系列でも表示できますので、広く浅く購買活動を知るマス・マーケティングではなく、ネット上でのクチコミ情報がどのくらいの期間にどのように展開されていくのかを判別する『バズ・マーケティング』的な活用も期待できます」(浅野)

価値観の多様化を背景に、今後市場はさらに細分化が進んでいくだろう。また、市場の主導権はメーカーや販売者中心のプロダクトアウトから、購買者に基軸を置いたマーケットインなものへと確実にシフトしている。ここにおいて同じ興味を抱いた人や、実際の購入者やユーザの評価を一望することができるこのサービスを求める声は、さらに拡大していくに違いない。

(取材協力)
NTTサイバースペース研究所 音声言語メディア処理プロジェクト
音声・言語基盤技術グループ
グループリーダー 
主幹研究員:菊井 玄一郎
主任研究員:浅野 久子

フッタエリアはここからです。