ページの先頭です。
コンテンツエリアはここからです。
注目のキーワード!

vol.3 『Jubatus(ユバタス)』 ビッグデータを「大量に」「素早く」「深く」解析できる仕組み

第二部 誕生の背景と現状、そして将来 〜企業の枠を超えたエコシステムへ〜

第二部では、「Jubatus」の開発を手がけるNTTソフトウェアイノベーションセンタを訪ね、担当者に「Jubatus」への思いや取り組みなどを語ってもらった。

開発への思いとエコシステム - 枠を超えて、「Jubatus」で創る新たなサービス

「Jubatus」を担当するNTTソフトウェアイノベーションセンタ 分散処理基盤技術プロジェクト・主任研究員である北山禅は、開発の動機について次のように話す。

「初めは“面白そう” “やってみたい”という思いからスタートしました。ビッグデータ分析で、機械学習のような高度な分析をリアルタイムに行える技術というのはまだほとんど見当たりませんが、それをオープンソースとして世の中に出せれば社会に貢献できるのではないかと考えました。Jubatusを通じレコメンデーションやSNS分析以外にも、例えばDNA研究やバイオ分野などまだ活用の少ないフィールドにも利用が広がり、新しい発見が生まれるとうれしいですね。さらにソースコードを見える形で公開し、さまざまな方に利用していただいてその声を聞くことは開発者として非常にエキサイティングな取り組みでもあり、また、より使いやすく、価値の高いソフトウェアに成長させる良い方法だと考えています」

自由な利用から新しい活用方法が生まれ、新規ビジネスやサービスが誕生し、市場が活性化されていく。その利用の中でプロダクトも磨かれていく・・・。それが「Jubatus」をオープンソースとした狙いである。

しかし、ビッグデータ分析がさらに広がっていくには分析基盤の開発だけでは足りない、と北山は続ける。

Jubatusエコシステム概要図

「ビッグデータ分析は“データ” “分析者” “分析基盤”がそろって進められるものですが、現状ではデータを持つ人はどう分析すれば良いかわからず、分析できる人には必要なデータが手に入らないなど、それぞれが分断された状態となっています。ビッグデータ分析に関係するさまざまな立場の人が交流し、活動できる場、いわばエコシステムの形成が必要だと考えています。私たち研究所の名前はソフトウェアイノベーション“センタ”ですが、この“センタ”には“ソフトウェアにかかる中心的存在たること”という思いが込められています。研究・開発にとどまらず、オープンソースで世界に働きかける、エコシステムを具体化するなど、リアルな人間の営みを巻き込んだイノベーションの実態化を狙うことも我々の取り組みであると考えています。そういった考えから昨年夏に学生向けアイデアコンテストを開催しました」

エコシステムのステークホルダー - データサイエンティストの育成とエコシステムの形成

本格的なビッグデータ時代到来の中で、データ解析のプロフェッショナルとしてデータの意味を理解し、その中から新たな価値を見いだすデータサイエンティストの存在が注目され始めている。データサイエンティストは、統計学と分散処理技術の両方に精通し、さらにデータの蓄積と分析が実際に活用されるビジネスドメインそのものも熟知していなければならない。しかし、そのようなデータサイエンティストの資質を持つ人材は極めて少ないのが実情である。

大賞に輝いた、早稲田大学先進理工学部の杉浦太樹さん、松林祐さん、望月駿一さんのチーム

NTTでは、データサイエンティストの育成とエコシステムの形成を加速させる一環として2012年夏、学生を対象に“Jubatus Challenge Japan 2012”を実施した。「Jubatus」を用いた分析サービスアイデアを募集したこのコンテストは、東京と大阪で計3回のアイデアソンが開催され、9月22日に東京・渋谷で最終報告会が開催された。目新しさ、有用性、実現性などを基軸に外部審査員に評価をお願いし、化粧品クチコミサイトのクチコミデータを利用し「ユーザーの潜在的な好みを反映した美容品レコメンド」というテーマで発表したチームが大賞に輝いた。

このコンテストでは、多岐にわたるビジネスフィールドで活躍する企業が、実際のデータを提供してくれた。その分析を通じて新たなビジネス形成のアイデアを築こう、というこのイベントは、まさに情報提供者〜基盤開発者〜企画者〜開発・分析者の連携によって、新しい市場や産業を生み出そうというエコシステムのひな型となった。分散処理基盤技術プロジェクト・研究主任の千葉一深は、このイベントのメリットを以下のように説明する。

「参加していただいた学生たちには、Jubatusを快適に活用することができる実行環境とともに、NTTのクラウド環境でビジネス最前線の実データを提供しました。学生からは、自らの消費者目線に立ったさまざまなアイデアを提案いただきました。また、データをご提供いただいた企業サイドも、業界常識にとらわれない学生の自由な発想や、プロであるが故に見逃してしまいがちな盲点を突いた斬新な視点から、データ利用のアイデアや新しい価値を見いだす良い機会になったと思います」

例えば、コミュニティに敷居の高さを感じて、なかなか参入しにくかった人たちも、アイデア提案などの形で参画することができ、チームメンバー同士、あるいはチーム同士で刺激し合う構造が生まれた。その一方で、統計や分散処理を学んでいる学生も、実データを用いた分析の経験は少なく「なかなか狙い通りには進まず難しい」ことを痛感したようだ。その意味でも、今回のコンテストは、今後社会ニーズの高まりが期待されるデータサイエンティストを目指そうという若い人材にとって、ポジティブな励みになったはずだ。

Jubatus Challenge Japan 2012 最終報告会の様子

このように、学生はリアルデータに触れるチャンスを、またデータ提供企業は、新たな『気づき』を得る機会ができた。学生と企業の双方に、今後のビッグデータ活用を指し示す貴重なチャンスとなったが、開発者の立場から千葉はこう続ける。

「もちろん、データ提供者とその活用アイデアを追求する人たちを架け橋することで、開発者である私たちも、さらに立体的な視点を獲得することができました。またその過程で、Jubatusを磨き上げていくためのさまざまな示唆を得ることもできました」

「今後はデータの品ぞろえを拡大するとともに、データを持っている企業の方やビジネス経験を持った社会人と自由な発想を持った学生の混合チームなど、さらにバラエティー豊かなアイデアの開花を支援したいですね」

このコンテストは、今回の成果と課題を踏まえた上で2013年度以降も続けていく予定だ。

※「Jubatus Challenge Japan 2012」の公式Facebookはこちら。

 

求められる開発者像 - 世界に向かって提案・発信していく若い人材に期待

「Jubatus」の開発チームは、「今後もOSSならではのメリットを生かし、ユーザーのニーズを吸収しながら、データ分析や分散処理の知識がない人でも、自由に分析が行える環境を提供したい」と考えている。「Jubatus」を育て、普及させていくには開発者にもユーザーの利用場面を想定した視点が求められる。

最後に北山は、これから「Jubatus」の成長を加速する “期待される開発者像”について次のように語った。

「OSSであるJubatusの成長には、新しいアイデアをさまざまな立場の人と共有し意見を交わし形にしていくことが重要です。提案力、発信力に優れ、新しい技術を実現することが何よりも好きな若い人たちが、このフィールドに飛び込んできてくれることを願っています」

NTTの「Jubatus」に関連する最新ニュースの一部

取材協力

NTTサービスイノベーション総合研究所 ソフトウェアイノベーションセンタ 
分散処理基盤技術プロジェクト

NTTサービスイノベーション総合研究所 ソフトウェアイノベーションセンタ 分散処理基盤技術プロジェクト 主任研究員 北山 禅(きたやま ゆずる)、研究主任 千葉 一深(ちば ひとみ)

(右) 主任研究員
北山 禅(きたやま ゆずる)

(左) 研究主任
千葉 一深(ちば ひとみ)

NTTソフトウェアイノベーションセンタのホームページ(別ウインドウが開きます)



フッタエリアはここからです。