News Release


平成12年3月15日

日本電信電話株式会社



音声による対話が可能な自動プレゼンテーション技術を開発
―コンピュータによる商品紹介・情報案内がより自然に!!―


 日本電信電話株式会社(以下、NTT)は、お客様がコンピュータ画面上のエージェントと音声で対話する形で、商品説明や情報案内などを行う対話型自動プレゼンテーション技術「サイバープレゼンター」を開発しました。
 従来の音声対話技術では、決められた項目を決められた順序で発声するなど、システムの操作法をお客様がある程度知っている必要があり、初めての方に気軽に使って頂けるレベルではありませんでした。
 サイバープレゼンターは、お客様がシステムの操作法を全く知らない場合でも、その発言の内容から操作の「慣れ」(習熟度)を推定し、必要に応じて説明の内容や方法をダイナミックに変えてプレゼンテーションする技術です。これによって、初心者でも経験者でもその人に合わせた快適な情報案内が可能になります。
 プレゼンテーションコンテンツの開発には、「コンテンツ作成ツール」を利用し、音声認識、音声合成、対話処理に関する専門知識がなくても、従来1カ月かけて作成していたコンテンツを1週間程度で作成できます。
 本技術は、店頭や展示会の一方的な商品説明ビデオの代わりに、対話により商品を紹介したり、テーマパークで対話型の道案内を行う等、実用性と娯楽性を合わせ持つプレゼンテーションを実現します。さらに、インターネットを介してインタラクティブに学習を進める教材、インタラクティブ絵本、製品の使用マニュアル、ホームページ上からの情報提供など、ネットビジネスにおいても広範な用途が考えられます。


<開発の背景>

 社会の情報化に伴い、コンピュータは社会生活に欠かせない道具になりつつあります。しかし、その操作には依然としてキーボードやマウスが用いられており、これらの操作に不慣れな方は、情報流通の恩恵を十分に受けることができませんでした。
 近年、この問題に対する一つの答えとして、音声認識、音声合成、アニメーションを連携した対話型インターフェースが登場してきています。しかし、これまでの音声対話技術では、対話のシナリオが固定されており、例えば「どの場面でどの単語を発声できるか」等の制限を、お客様が事前にマニュアルで理解しておく必要がありました。これでは、初心者が簡単に利用することができません。
 社会の情報化をよりよい方向に進めるためには、初心者から熟練者までいろいろな層の方々が、快適にネットワークにアクセスし、情報の授受を行える音声対話インターフェースの開発が急務です。


<主な特徴>

(1) お客様の習熟度に応じた自動プレゼンテーション技術を開発

 画面上のエージェントが、初心者から経験者まで様々なお客様と音声で対話しながら、情報を提供する自動プレゼンテーションを行います。音声認識、音声合成、対話処理を有機的に組み合わせることによって、対話の進行からお客様の習熟度を判定し、対話を快適に進めます。例えば、音声認識の結果が続けてリジェクトされるときは、対話知識によって「認識できる単語の種類を知らない」と判定し、「赤い文字の単語を話してほしい」と音声ガイダンスで案内します。このような、音声認識、音声合成、対話処理の連携を規則として多数保有し、対話の状況に応じて切り替えることにより、初心者から経験者まで、その人の習熟度に応じたスムーズなプレゼンテーションを実現します。


(2)


操作性に優れたコンテンツ作成ツールで高度な対話シナリオを効率的に開発

 「サイバープレゼンター」では、コンテンツ作成をプログラミングや、音声認識、音声合成に関する知識がない人でも簡単に行えるように、分かりやすいGUI(*1)操作のコンテンツ作成ツールが提供され、お客様の習熟度に合わせた対話シナリオの作成を、簡単な操作で行うことができす。
 このコンテンツ作成ツールには、NTTが長年の研究で培った対話処理技術が埋めこまれており、簡単な操作によって様々な対話処理の技法を利用することができます。従来の対話システム設計ツールでは、複雑な対話を実現するために長い開発期間が必要でしたが、「サイバープレゼンター」のコンテンツ作成ツールでは、お客様と対話しながら習熟度を自動的に判定する仕組みや、音声の認識誤り時にスムーズな対応を行う仕組みなどを持つ対話システムを、短期間で開発することができます。


(3)


高性能音声認識エンジンと高品質音声合成エンジンを採用

 「サイバープレゼンター」は、NTTが独自に開発した最新の不特定話者用音声認識エンジン「VoiceRex」と、テキストから音声に変換する音声合成エンジン「FinalFluet」を採用し、自然な音声対話を実現しています。



<用語解説>

*1 :GUI(Graphical User Interface)
視覚的に理解しやすいアイコンなどのグラフィックを利用して表示や入力を行う方式のユーザインタフェース。



別紙
サイバープレゼンターの構成
サイバープレゼンターデモ画面




<本件に関する問い合わせ先>
 NTTサイバーコミュニケーション総合研究所
 情報戦略担当 萩野、坂本
 TEL:0468-59-2032
 e-mail:ckoho@tamail.rdc.ntt.co.jp



News Release Mark
NTT NEWS RELEASE