株式会社ローソンチケット(以下 ローソンチケット、本社:東京都渋谷区、代表取締役社長 岡田 稔)、日本電信電話株式会社(以下NTT、本社:東京都千代田区、代表取締役社長:和田紀夫)、NTTアイティ株式会社(以下 NTTアイティ、本社:横浜市中区、代表取締役社長:橋田幸雄)の3社は、ローソンチケット チケット情報提供カスタマーセンターにおいて、最新の音声合成技術と、コンピュータによる自動応答機能を連携させた、チケット情報自動アナウンスサービス(以下 チケアナ)の検証・評価のための共同実験(別紙1-1、1-2)を開始いたします。
この共同実験は、NTTコミュニケーションズ株式会社(以下 NTT Com、本社:東京都千代田区、代表取締役社長:鈴木正誠)が提供するVポータルダイレクト*1を利用したローソンチケット インフォメーションダイヤル*2(0570-000-403)にて、2004年6月1日〜11月30日まで実施いたします。 |
1. 本実験の背景と目的 |
 | ローソンチケットは、ローソンが全国7,821店舗(2004年2月末現在)に設置しているマルチメディア端末「Loppi(ロッピー)」、インターネットサイト及びモバイルサイトでのオンラインによるチケット予約システムを用いたお客様へのサービス提供と併せ、カスタマーセンターでは、インフォメーションダイヤルへ直接お電話頂いたお客様からのお問い合わせに対し、Vポータルダイレクトによって発売情報・空席情報等をご案内しております。
しかし、現在このインフォメーションダイヤルでは、お客様がオペレーターとの対話を選択された場合、その後は全てオペレーターによる情報案内を行っているため、人気アーティストの公演発売日などには、お問い合わせが集中してしまい、通話がつながりにくく、その他のお客様対応が限られる場合がありました。そこで受電率を向上させるためオペレーター稼動の効率化が急務となっておりました。
一方、NTT、NTTアイティ、NTT Comでは、音声応答・音声合成/認識の機能と企業側の音声コンテンツを連携させ、お客様への音声による情報提供を実現するVポータルダイレクトを開発・提供しております。
今回のチケアナでは、Vポータルダイレクトへお客様から入ってきた定型回答可能な問い合わせに対し、あらかじめ登録しておいた合成音声をコンピュータが自動で回答するオペレーター協調応答機能を導入します。ここで利用する合成音声の作成には、NTTサイバースペース研究所が新たに開発した電話音声用コーパスベース*3テキスト音声合成技術(開発名称「Cralinet」)(別紙2)を基盤とし、Webベースの音声合成環境により、手軽で高品質な合成音声の作成を可能としています。
本共同実験は、音声コンテンツ作成の効率化、カスタマーセンター処理能力の改善および実環境での技術検証を行うことを目的としています。 |
2. 実験の概要 |
 | (1)実験場所 |
|
 | ローソンチケット インフォメーションダイヤル(0570-000-403)カスタマーセンター |
 | (2)実験期間 |
|
 | 2004年6月1日〜11月30日まで |
 | (3)コンテンツ |
|
 | ローソンチケット インフォメーションダイヤル内のチケット発売情報 |
 | (4)実験内容 |
|
 | 上記インフォメーションダイヤルにおいてチケアナを導入し、お客様のお問い合わせに対する受電率向上を実現するサービスの効果・実用性を検証します。 |
3. 各社の役割 |
 | (1)ローソンチケット |
|
 | 本実験システムをインフォメーションダイヤルへ導入することによる受電率向上の効果とカスタマーセンター業務効率化を検証します。 |
 | (2)NTT |
|
 | 定型回答用の音声コンテンツ作成の基盤となる電話音声用コーパスベーステキスト音声合成技術を提供し、技術的検証を行います。 |
 | (3)NTTアイティ |
|
 | オペレーター協調応答機能の技術検証と、ビジネス性の検証を行います。 |
 | (4)NTT Com |
|
 | Vポータルダイレクトを提供し、スムーズな共同実験の進行をサポートします。 |
4. 技術のポイント |
 | (1)電話音声用コーパスベーステキスト音声合成技術「Cralinet」 |
|
 | 入力された文章から、アナウンサーによる録音音声と同等品質の合成音声を自動的に生成します。合成音声の高品質化のためには、大規模な音声データベース(DB)が必須ですが、DBの大規模化に伴なう処理速度の低下は実用面における課題でした。また、情報案内等で頻出する振り仮名付き姓名等の単語の正確なイントネーションでの読み上げや、英語等の外国語やローマ字が混在するアルファベット単語に対する正確な読みの付与は大きな課題でした。
本技術では、音声DBからの音声素片*4の高速アクセスと、最適な音声素片組み合わせ探索の高速化により、実時間(実音声時間)の10%以下での音声合成を実現しました。また、あらかじめ統計的機械学習方法により読み仮名列とアクセントの関係や、アルファベット文字列と読み仮名、アクセントの関係を大量のデータから学習しておくことで、精度の高い仮名付き姓名に対する自動アクセント付与、及びアルファベット単語に対する読み・アクセント付与を実現しました。
以上のような課題解決によって、従来の合成音声と比較して飛躍的な高品質化が達成され、アナウンサーによる読み上げと同等レベルの音声合成の実現に成功しました。 |
 | (2)オペレーター協調応答機能 |
|
 |
本機能は、従来には無かったシステムとカスタマーセンターのオペレーター間の相互的な音声案内を実現する機能です。具体的には、Vポータルダイレクトでオペレーターの介在が必要な問い合わせは、カスタマーセンターのCTIシステム*5に転送され、スクリーン・ポップアップ*6機能を利用して、あらかじめ登録されている回答音声の複数候補をオペレーター画面に表示します。オペレーターは、お客様の問い合わせ内容により、これら候補の中から適切な回答音声を選択し、Vポータルダイレクトから自動再生することができ、音声の自動再生開始後は、オペレーターは解放されて次のお客様の応対を行うことができます。また、自動再生された音声で用件が解決されなかった時には、再度オペレーターへ転送されますが、その際、オペレーター画面には直前の応対履歴を表示します。
これにより、1問い合わせあたりの応対時間の短縮による受電率の向上が図れ、また履歴に応じた適切な回答を行うことができるため、きめ細かなサービスの提供を実現します。さらに、Vポータルダイレクトとの連携により、大規模な設備投資が必要ないことから、比較的安価にシステム構築が可能となります。 |
5. 今後の展開 |
 | ローソンチケットでは、本実験の結果を踏まえ、導入の検討を行うとともに、お客様満足度の向上に努めてまいります。
また、NTTでは、今後も需要が期待されている各種情報案内サービスでの利用を想定し、その基盤となる自然で滑らかな音声合成技術の開発に取り組んでいきます。
一方、NTTアイティ、NTT Comでは、実験の結果をふまえ、Vポータルダイレクトへの新機能実装を検討し、更なる高機能化のための開発およびビジネス展開を進めていきます。 |
[用語解説]
| (*1) |
Vポータルダイレクト
NTT Comが提供する、音声による情報提供システム。これによりコンテンツ提供事業者は、専用のアクセス番号での音声による自動応答サービスを低価格で構築できます。 |
| (*2) |
インフォメーションダイヤル
NTT Comが提供するVポータルダイレクトを用いて、音声応答、オペレーターへの転送によりチケット情報を提供するローソンチケットのサービス名称。 |
| (*3) |
コーパスベース
大量かつ多様なデータ(コーパス)を利用すること、またはコーパスを収めたデータベースを利用すること。
特に音声合成では、数時間から数十時間の音声を収めた音声データベースを利用して、音声合成を行うことを示します。 |
| (*4) |
音声素片
何らかの基準で切断された音声の断片のこと。音声合成では音声データ中の音素や音節等の単位で切断された音声の断片を音声素片として利用します。 |
| (*5) |
CTIシステム(Computer Telephony Integration System)
PBXなどの電話系通信システムと、コンピュータやデータベースなどの情報系システムとを結合し、相互に連動できるようにしたシステムのこと。本実験では、「スマートコンタクトセンター(NTT Com製品)」を利用しています。 |
| (*6) |
スクリーン・ポップアップ
着信と同時にそのお客様の関連する情報をパソコン画面に表示させること。 |
|