Jubatus(ユバタス)

ひかりちゃん

それでは、情報流通プラットフォーム研究所の木下研究員に代わって、研究マスコットのユバタス君に質問してみましょう!

これはどんな技術なのでしょうか?

デジタル化が進んだ結果、インターネット上での書き込み、画像ファイル、センサー情報など、多様でサイズの大きなデータが増えてきました。こうした「ビッグデータ」と呼ばれるデータを分析することで、さまざまな情報を得ることができます。
この技術は、こうしたビッグデータを、「リアルタイム」で「深く分析」するためのものです。多くの人に使ってもらえるよう、ソースコードというプログラムの設計図もインターネット上に公開しており、誰でもダウンロードして利用できるようになっています。なお、私の姿を見ればおわかりのとおり、このJubatusという名前はチーターの学名からとったもので、「ゆばたす」と読みます。

他の技術とはどこが違っているのでしょうか?

他の類似の技術では、Hadoopというソフトウェアが有名なのですが、Hadoopは分析する対象となるデータをいったんどこかに蓄積してから、まとめて処理を行います。また、集計などの単純な分析くらいしかできませんでした。
その点、Jubatusは、データを蓄積せずに、データを受け取ると同時にリアルタイムで処理を行うことができます。また、単純な集計だけでなく、自動分類をはじめとしたさまざまな機械学習の手法をサポートしているため、高度な分析を行うこともできます。

Hadoopは、Apacheソフトウェア財団の米国及びその他の国における登録商標です。

この技術が利用されるようになると、私たちの生活はどれくらい便利になるのですか?

ビッグデータを分析することで、それまで気づかなかったいろいろな情報を得ることができます。たとえば、1秒で8,000個以上ものつぶやきがあるTwitterの中にある自社製品についての口コミ情報を調べることで、緻密なマーケット分析を行うことができるようになります。たとえ、つぶやきの中に商品名が書かれていなくても関連の高さなどをJubatusが自動解析してくれるので、人間は分析結果の確認だけに集中できます。また、リアルタイム分析でトレンドの変化に素早く対応させられるので、オンラインショップなどでお勧め商品情報もより精度の高いものになります。 今後は、協調フィルタリングやクラスタリングといった、さらに複雑な分析もできるようになっていきますので、みなさん期待していてください。

ありがとうございました。ロボットの私よりも賢いチーターなんですね!