概要
コンピュータと人、あるいは人と人とのコミュニケーションを支援するメディア処理技術として、NTTでは幅広いサービス分野に適用可能な音声認識技術(開発名:VoiceRex)の研究開発を実施しています。VoiceRexは、事前の学習を要さずに、マイクや電話からの音声入力に対して、高い認識精度を発揮できる特長があります。また、小学生から高齢者までの幅広い年齢層の音声にも対応可能です。インターネット電話音声の認識にも対応しています。さらに、従来水準をはるかに上回る、1,000万単語を登録した音声認識用辞書を用いたリアルタイム連続音声認識も実現可能です。
応用サービス例としては、電話による音声ポータルサービスがあります。利用者がシステムに話しかける自然な発話の認識にも対応しているので、音声対話によって情報検索を行うサービスなどにも適用可能です。さらに、人と人が自由に会話する話し言葉音声の認識技術の開発を進め、自治体などの議会録作成を支援するシステムへ応用することを検討中です。今後も、快適、便利な音声コミュニケーションの実現をめざして研究開発を進めます。

