ページの先頭です。
コンテンツエリアはここからです。

時間と空間を自在に予測するAI

vol01
未来予測のベースとなった「多次元複合データ分析」技術
NTTサービスエボリューション研究所 宮本勝
NTTコミュニケーション科学基礎研究所 澤田宏

時間と空間を自在に予測するAI技術01:未来予測のベースとなった「多次元複合データ分析」技術

人の行動をいくつもの軸で分析する
「多次元複合データ分析」

――AIで、時間と空間を自在に予測することができる技術を開発していると聞きました。いったいどんな技術なのでしょうか?

澤田 「時空間予測技術」をご説明する前に、まずそのベースとなった技術「多次元複合データ分析」 についてお話させてください。私たちは常に人間の社会活動をとらえ、そこからなんらかの知見を得たいと考え、研究を重ねています。そのとき、一つの方法論として、人の行動を、たとえば「だれが」「いつ」「どこで」「なにを」買った、というようにいくつかの「軸」に分解し、それぞれを集計・分析するというものがあります。「20代男性が/深夜/コンビニで/雑誌を」買うといった具合に。その結果、なんらかの傾向がわかれば、たとえばマーケティングや物流など、さまざまな分野で役立つ可能性がある。

――人間の行動を統計的に把握するということですね。

澤田 現在、コンビニエンスストアのPOSなどを利用して、大量のデータを集めることはできます。しかし集まった膨大なデータをどのように見ていくか。ここに1つ課題があるのです。1つの軸だけに着目するなら、話は簡単です。たとえば「いつ」に着目するとすれば、単純な話、1日を24時間に分ければいい。「いつ」「どこで」であれば、24時間に、たとえば山手線の駅29駅をかけたとして、696通り。2軸程度であれば、人間がデータを直接参照できる範囲かもしれません。ところがこれが3軸、4軸と次元が増えていくと、その掛け合わせの数は数万、数千万、数億と、飛躍的に増大していく。とても現実的には追いきれないデータ数になっていくのです。この課題を解決するのが、私たちの開発した「多次元複合データ分析」 です。

――具体的には、どのような技術なのでしょうか?

澤田 たとえば「どこで」「なにを」という2軸があるとき、1軸ごとにデータを見た時にも、2軸の特徴が出てくるように集計する、という技術です。「どこで」「なにを」を集計した結果が「スーパーではパンと牛乳が売れる」「コンビニではタバコ・缶コーヒーが売れる」となったとします。その時、「パン・牛乳」、「タバコ・缶コーヒー」という「なにを」のかたまりには、それぞれ「スーパー」と「コンビニ」という「どこで」との関係性が残っている。そうなるようにデータを分解する技術なのです。

――そうすることで、集計の効率化が図れるわけですね。

澤田 多次元データの分析にはもう一つ課題があって、それは「スパース(疎)性」の問題です。先程申し上げたように、集計の軸が増えると、組み合わせの数は飛躍的に増大する。しかし私たちの社会活動で実際に集められるデータは、その組み合わせの数より遥かに少ないことが多い。

宮本 わかりやすく言いますと、たとえば1日は24時間ある。あるいは日本全国の国土を緯度と経度の組み合わせで表記すると、かなりの組み合わせの数になる。ところが、人間は夜には活動しなかったり、都市部に集中したりして、実際の行動は非常に偏っています。ですから数学的に表現される組み合わせの数は膨大でも、観測できるデータはその一部でしかもすごく偏っている。

澤田 この偏った、まばら(疎)なデータをうまく活用して、効率的に精密な分析結果が出るように工夫したことも、私たちの技術の特徴です。具体的には複数の軸をそのまま使って集計・分析するのではなく、軸をグループ化するのです。たとえば「だれが/いつ」と「だれが/どこで/なにを」の2つのグループにする。2軸と3軸の掛け合わせにすると、4軸をそのまま集計するとしたら数十億通りの組み合わせだったものが、たとえば数百万とか数十万とかに減っていくわけです。どちらのグループにも「だれが」があることがポイントで、この共通する軸を紐付けることで、それぞれの軸の関係性が分析できるわけです。

――膨大なデータの中の、複数の軸の関係性を効率的かつ精密に分析する技術が「多次元複合データ分析」 だ、ということなのですね。

関連リンク
多次元複合データ分析から時空間多次元集合 データ解析技術へ
http://www.ntt.co.jp/journal/1512/files/jn201512015.pdf

制約があるからこそ作れる、
時空間予測モデル

澤田 この「多次元複合データ分析」 の技術をどのように活用するか、研究所で検討しているときに、「時空間」というテーマが浮かび上がってきたのです。時間や空間には、連続性がある。その特性をうまく活かすことができたら、未来予測のようなことができるのではないか。そこから「時空間予測技術」の研究がスタートしました。

――時間や空間を扱う「未来予測」となると、より難しくなるのではないかと考えてしまうのですが。

澤田 むしろ時間や空間の持つ特性や制約をうまく活かし、モデル化することで、たとえばある集団がどう動いているのか、これからどう動くのを正確に予測するということが可能になるのではないかと考えました。

宮本 たとえばAさんの歩行速度が時速5キロだとしたら、その速度は大きく変動しない。だから、一定の時間で行ける範囲は限られている。どこかにワープしたりはできないのです。これが「連続性」ということで、つまり、たとえば今から10分後の状態は、1時間後の状態よりも、今に近いはずなのです。実世界にはそうした制約がある。その制約条件をうまく組み込んでいくと、予測ができる。

澤田 多次元でのデータ分析を可能にした技術もさることながら、それを時空間に適用するための研究を進めているところが、私たちの研究のオリジナリティであり、アドバンテージだと考えています。

前の記事へ次の記事へ
宮本勝
宮本勝

プロフィール
日本電信電話株式会社サービスエボリューション研究所主幹研究員。1997年NTTに入社。ヒューマンインタフェース関連の研究に従事後、角川書店と連携した株式会社ウォーカープラスの立ち上げに参画。2009年NTT研究企画部門に異動後、プロデューサとしてビッグデータ関連のサービス創造を推進。2014年に研究所に戻り現職。

関連リンク
NTTサービスエボリューション研究所 
http://www.ntt.co.jp/svlab/mission/organization/Service_evolution.html
宮本勝
澤田宏

プロフィール
日本電信電話株式会社コミュニケーション科学基礎研究所協創情報研究部部長(上席特別研究員)。1993年NTTに入社。以来、計算機アーキテクチャ、信号処理、機械学習、データ分析の研究に従事。

関連リンク
NTTコミュニケーション科学基礎研究所 
http://www.kecl.ntt.co.jp/rps/index.html

ローカルナビはここからです。