ページの先頭です。
コンテンツエリアはここからです。

「AI化」する技術と社会の未来に、
「corevo」は、どう向き合うのか?

vol02
「ヒト」「モノ」のコミュニケーションを、AIで支援する「corevo」の4つの方向性
メディアインテリジェンス研究所所長 小澤 英昭

「AI化」する技術と社会の未来に、「corevo」は、どう向き合うのか? 02:「ヒト」「モノ」のコミュニケーションを、AIで支援する「corevo」の4つの方向性

NTTインターコミュニケーション・センター (ICC)/《ドローイング・オペレーションズ・ユニット:ジェネレーション2(メモリー)》 [2017] スグウェン・チャン

人間の意図や感情を理解し、
自然なコミュニケーションを目指す「Agent-AI」

ネットワーク/コミュニケーションの企業であるNTTグループとして、どうAIに向き合うのか。「corevo®」では、AI関連技術群を、大きく4つの方向性に整理しています。それぞれの方向性について詳しくお伝えすることで、その問いにお答えできればと思います。

まず、「Agent-AI(エージェントAI)」は、人間の音声やカメラで撮影される表情の、映像などの表層的に表れる情報から、意図や感情を理解することを目的にしたAIです。代表的なものは、コールセンタやコンタクトセンタに寄せられるお客様の音声情報を収集・分析し、応対品質の向上や、経営課題の抽出を目指すというもの。NTTテクノクロスが提供している「ForeSight Voice Mining®  」などは典型的な事例ですが、コンタクトセンタに寄せられるお客様の声(電話音声)を収集してAIの技術の一つである音声認識技術でコンピュータが分かるようにテキスト化しこれを分析することで、コンタクトセンタに寄せられたお役様のクレームの傾向や、個々のお客様の感情を抽出することが可能です。また、NTTコミュニケーションズの「Communication Engine COTOHA®(コトハ)  」のように、人の話し言葉や書き言葉を高い精度で分析・理解し、ユーザと自然なコミュニケーションしながら、問い合わせ対応や購入対応などを行うことのできる「チャットボット」(※1)とAIを連携させたサービスも、「Agent-AI」の成果の一つと言えるでしょう。

こうした「ヒトとAIとのコミュニケーション技術」は、AI技術の中でも実用化が進んでいる分野で、すでにさまざまなサービスがリリースされていますが、私たちは、さらにヒトとAIのコミュニケーションの質を高めるための研究も行っています。私が所長を務めるメディアインテリジェンス研究所の東中竜一郎主任研究員が研究している「雑談」  などは、その代表的な例でしょう。人間の会話の大部分を占めると言われる、意味や目的のはっきりしない「雑談」をAIが理解し、対応できるようになれば、ヒトとAIとの対話の自然さは飛躍的に増大し、会話の満足度は高まります。

※1:チャットボット
「チャット(おしゃべり)」と「ボット(ロボット)」をかけ合わせた造語。テキストや音声などによって、自動的に会話を行うプログラムのこと。

関連リンク
ForeSight Voice Mining®(NTTテクノクロス)
https://www.ntt-tx.co.jp/whatsnew/2016/161012.html
      
Communication Engine COTOHA®(コトハ)(NTTコミュニケーションズ)
http://www.ntt.com/business/services/application/ai/cotoha.html
      
研究員紹介 東中竜一郎(メディアインテリジェンス研究所)
http://www.ntt-holdings.cn/md/profile/higashinaka.html

脳科学や生体センサを活用し
人間の「本質」に迫る「Heart-Touching-AI」

「Agent-AI」よりも、もう少し深い階層、言ってみれば「人間の本質」に迫るような領域、声や表情などの「表層」にはなかなかあらわれることのない人間の感情や意識を対象にしているのが「Heart-Touching-AI(ハートタッチングAI)」です。代表的な事例として、NTTコミュニケーション科学基礎研究所の柏野牧夫上席研究員がプロジェクトマネージャをつとめる「スポーツ脳科学プロジェクト  」が挙げられます。このプロジェクトではスポーツにおける「コツ」のような、可視化したり言葉では表しにくいことを、人間にどう伝達できるのかを考えています。その際、ウェアラブル生体センサ「hitoe®」 などを活用することで、選手の心拍や体温などをセンシングし、選手の「メンタル」の状態などを確認しながら脳科学などの知見も活用して最適なフィードバックの方法論を探っていきます。


「変幻灯®」技術を使ったインタラクティブ展示《変幻スケッチ》[2017]"Deformation Sketch" 制作:NTTサービスエボリューション研究所

また、ここ(注:インタビュー場所となった、NTTインターコミュニケーション・センター[ICC])に展示されている「変幻灯®」  のような作品も、「Heart-Touching-AI」の一種と言えるかもしれません。「変幻灯®」は、プロジェクションマッピング(※2)の手法を活用することで、動くはずのない風景画が風にそよいでいるように見えたり、人物の肖像写真の表情が変わって見えたりする不思議な展示です。「変幻灯®」は、人間が物を見る時に形と色と動きをそれぞれ認識し、頭の中で再合成することによって全体を把握するという最新の脳科学の研究成果を活用しています。そこで静止画の上に、光の陰影による動きの映像をプロジェクションマッピングで重ね合わせると、人間の「錯覚」によって、動いて見えるようになる訳です。AIが「認識」→「推論」→「合成」の3つのプロセスからなっていると考えている(第1回参照)私たちの立場からは、人間の脳の認知の仕方を学んで、目的(静止画が、人間には動いているように見える)を達成するために最適なアウトプットを「合成」するという意味で、これも一種のAIだと考えています。

※2:プロジェクションマッピング
コンピュータ・グラフィックと映写機器を使って、建物、物体、空間などに映像を映し出す技術。

関連リンク
スポーツ脳科学プロジェクト(NTT持株会社)
http://sports-brain.ilab.ntt.co.jp/
      
ウェアラブル生体センサ「hitoe®
http://www.ntt.co.jp/news2017/1702/170206a.html
      
変幻灯®
http://www.ntt.co.jp/news2015/1502/150217a.html
01「AI化」する技術と社会の未来に、「corevo」は、どう向き合うのか?

センサや環境の情報を活用して
リアルタイムで未来予測する「Ambient-AI」

「Ambient-AI(アンビエントAI)」は、ヒトやモノ、環境をセンシングして得られる情報から近未来の状態を予測、因果関係を推測し、得られた知見を制御に活用するAI技術群です。わかりやすい事例としては、監視カメラの映像などを分析し、複数のカメラに映る同一人物を識別するようなAIです。他にも例えばイマーシブテレプレゼンス技術「Kirari!®の中で使われている技術にもAmbient-AIに属するような技術があります。「Kirari!®」は、NTTのさまざまな技術を用いて、スポーツやライブ、あるいは会議などの中継の臨場感を高める技術です。たとえばスポーツ中継などにおいて、中継映像から、プレーしている選手をリアルタイムで抜き出し、擬似的な3D処理をして表示することで、中継会場の臨場感を高めます。「Kirari!®」を体験した皆さんは、選手が3Dで表示されていることに驚かれるのですが、実はこの技術の大きなポイントになっているのは、背景のある中継映像からリアルタイムで選手だけを抜き出す、という部分なのです。ここに「Ambient-AI」の技術が使われています。ブルーバックやグリーンバックなどを使い、特定の色を抜くことで人物を切り出す「クロマキー合成」(※3)ではなく、センシング技術と映像分析を組み合わせ、通常の中継映像から人物だけを抽出しています。距離センサーを使って人間までの距離を計測したり、また人間は周りよりも体温が高いことを利用して、熱の異なる領域を識別できる赤外線カメラを使うことで人間の位置を把握することと、背景が静止していた場合に、人物の動きを画像処理的に推定する技術とを組み合わせることで、人物だけを映像として抜き出すこの技術は、単にセンサーによる情報を分析するようなAIではなく、空間を理解するような「Ambient-AI」の分かりやすい例と言えるのではないでしょうか?

※3:アクロマキー合成
ある問題を解くための「手順」、またその手順を一定の方式で記述したもの。ある課題に対応するアルゴリズムを作成すると、別の課題にも適用することができれば、プログラミングの効率化が図れる。

関連リンク
イマーシブテレプレゼンス技術「Kirari!®」の研究開発が進展!(NTT持株会社)
http://www.ntt.co.jp/news2017/1702/170213b.html
【R&Dフォーラム2016】イマーシブテレプレゼンス技術”Kirari!”を活用したサービス

AIは、ネットワークし、コミュニケーションする
「Network-AI」で到来する未来のAI社会

私達は、AIを考える上で、2つのネットワークがあると思っています。一つ目はAI同士が接続される物理的なネットワーク、二つ目はAI同士がネットワークで結合されることで新たな付加価値を生む論理的なネットワークです。AIは物理的なネットワークにおいても故障の検知などの新たな価値を生みだしますし、複数のAIがコミュニケーションすることで、より複雑な事象や社会システムの分析・予測・制御をすることが可能になると考えています。「Network-AI」は、この2つの側面を持つAIの総称です。「Network-AI」のうち、物理的なネットワークに対するAIは、人間には見つけ出しにくい複合的な故障の検出や、ネットワーク障害の自動復旧  と言った研究開発が進んでいます。

AI同士のコミュニケーションによる「Network-AI」は、まだ検討が始まったばかりです。私は良く「三人寄れば文殊の知恵」ということわざで例えますが、確かに「AI同士を組み合わせれば、よりよい結果が得られる」という考え方はわかりやすいのですが、では「どう三人を寄らせるのか」については、様々な課題があります。人間の社会においても複数の人がチームを作り、最高のパフォーマンスを出すためには、同じ目標を共有し、コミュニケーションに使う言葉を合わせて意識を合わせていくように、チームの作り方、運営の仕方が大事になります。下手な組み合わせ方では、「船頭多くして、船、山に登る」などという事になりかねません。「Network-AI」においても同様だと考えており、最適な組み合わせやコミュニケーションのさせ方を追求するための研究は、はじまったばかりです。

「corevo®」が提示するAIの4つの方向性は
そのままNTTがAIに向き合う姿勢を表している

ここまで、「corevo®」の4つのAI技術群の方向性をご紹介してきました。この4つは、ひとまずは「ヒト」のAIである「Agent-AI」、「Heart-Touching-AI」と、「モノ」のAIである「Ambient-AI」、「Network-AI」の、大きく2つに分けることができます。「ヒト」のAIは、さらに「表層」的なフェーズである「Agent-AI」と、より「深い層」を対象とした「Heart-Touching AI」に分かれます。「Ambient-AI」は、環境の情報を活用して人間の役に立つためのAIです。「Network-AI」は、これら「ヒト」や「モノ」のAI同士をネットワークし、統合するための技術です。この4つの方向性は、そのまま私たちのAIに対する姿勢を表現してもいます。私たちの核にあるのは、「技術は人間に寄り添うべきである」という価値観、そして、通信・ネットワークの企業としての「すべての技術はネットワークによってつながっていく」という世界観です。第1回でも申し上げましたが、「AI」という言葉が表現するものは実に幅広い。すでに多くの企業・団体が、さまざまな「AI」の姿を提示しつつあります。その中で、私たちNTTとして、どのようにAIに向き合うのか。今お話しした4つの方向性が、その問いに対する回答そのものだと考えています。今後ますますAIの研究開発は盛んになり、技術は加速度的に進歩していくことでしょう。しかし将来においても、この4つの方向性、すなわち私たちがAIに向き合う姿勢は基本的には変わることがないと考えています。

小澤英昭
小澤英昭

プロフィール
日本電信電話株式会社メディアインテリジェンス研究所所長。平成3年NTT入社後、同社ヒューマンインタフェース研究所、サイバーソリューション研究所、 (株)ウォーカープラス、NTTレゾナントを経て現職。

関連リンク
メディアインテリジェンス研究所  
http://www.ntt.co.jp/md/
取材協力:
NTTインターコミュニケーション・センター[ICC]

NTTインターコミュニケーション・センター [ICC]は、NTT東日本が運営するメディア・アートの展示を中心とした文化施設です。

オープン・スペース 2017 未来の再創造 2017年5月27日 - 2018年3月11日

ローカルナビはここからです。