特集

魅力あるユーザ体験を創出するメディア系技術
全文記事PDF

本特集では、2020年に向けてNTTで取り組んでいる、音声、言語、音響、画像、映像などのメディア系技術によってもたらされる魅力あるユーザ体験に関するコンセプト、および各種技術について紹介する。


メディア系技術による魅力あるユーザ体験の創出
全文記事PDF

◆執筆者 高橋  敏/青野 裕司/小澤 史朗/奥田 英範/嵯峨田淳/谷田 隆一
◆所属 NTTメディアインテリジェンス研究所

本稿では、音声、言語、音響、画像、映像などNTTが広く取り組むメディア系技術によってもたらされる魅力あるユーザ体験の創出に関する取り組みを紹介します。ユーザに寄り添うエージェントを通じて人間の知や行動を活性化するパーソナライズサービス、極めて自然な視聴体験を享受できる高臨場メディアサービスの2つの観点で紹介します。


移動における“おもてなし”を実現するメディア処理技術
全文記事PDF

◆執筆者 堀井 統之+1/荒井 和博+1/永田 昌明+2/柏野 邦夫+2/平松  薫+2/深山  篤+3/山口  仁+3
◆所属 +1 NTTメディアインテリジェンス研究所
+2 NTTコミュニケーション科学基礎研究所
+3 NTTサービスエボリューション研究所

本稿では、街中でユーザを誘導するような、移動における“おもてなし”を実現するサービスイメージと、それを支える「統計的機械翻訳技術」「ロバストメディア探索技術(RMS)」について紹介します。


情報検索における“おもてなし”を実現するメディア処理技術
全文記事PDF

◆執筆者 貞光 九月+1/島村  潤+1/入江  豪+1/田良島 周平+1/吉田 大我+1/東中 竜一郎+1/西川  仁+1/宮崎  昇+1/井島 勇祐+1/中村 幸博+2
◆所属 +1 NTTメディアインテリジェンス研究所
+2 NTTサービスエボリューション研究所

本稿では、日々の活動におけるユーザの身の周りで個人をアシストするような、情報検索における“おもてなし”を実現するサービスイメージと、それを支える「画像による被写体識別技術」「人を理解し、自然に応答するための自然言語処理技術」「多様な話者・口調の合成音声を生成可能な音声合成技術」について紹介します。


ビジネスシーンにおけるサポートを実現するメディア処理技術
全文記事PDF

◆執筆者 大庭 隆伸+1/小林 和則+1/植松  尚+1/浅見 太一+1/丹羽 健太+1/鎌土 記良+1/川瀬 智子+1/堀  貴明+2
◆所属 ++1 NTTメディアインテリジェンス研究所
+2 NTTコミュニケーション科学基礎研究所

本稿では、ビジネスシーンにおいて業務をサポートするサービスの実現に向けた取り組みとして、工場や建設現場など非常に騒がしい場所での音声認識の活用、会議音声の認識による議事録作成支援の2つを紹介します。また、それを支える最新の音響・音声処理技術について紹介します。


高臨場観戦を盛り上げる映像音響技術
全文記事PDF

◆執筆者 三上  弾+1/國田  豊+1/鎌本  優+2/志水 信哉+1/丹羽 健太+1/木下 慶介+2
◆所属 +1 NTTメディアインテリジェンス研究所
+2 NTTコミュニケーション科学基礎研究所

スポーツイベントでは会場での観戦者よりはるかに多くの人がTV、インターネットなどを介して遠隔地から観戦・視聴します。近年、個人の嗜好・視聴スタイルが多様化し、視聴者が各々好みの方法で観戦を楽しむことが求められています。本稿では、現実に近い視聴体験の再現(高臨場感)と同時に、現実を超える体験の提供(超高臨場感)という2つの観点から、臨場感の高い視聴の提供を可能とするための映像音響技術に関するNTTの取り組みを紹介します。


主役登場
変化と寄り添う音声認識
全文記事PDF

◆執筆者 大庭 隆伸
◆所属 NTTメディアインテリジェンス研究所 研究主任

TOP

 著作権  プライバシーポリシー      Copyright(C)2004 日本電信電話株式会社