ページの先頭です。
コンテンツエリアはここからです。

NTT持株会社ニュースリリース

2014年10月30日

(報道発表資料)

日本電信電話株式会社
情報・システム研究機構 国立情報学研究所

国立情報学研究所の人工知能プロジェクト「ロボットは東大に入れるか」に
英語担当として参画し、初挑戦のセンター模試で好成績を達成!

 日本電信電話株式会社(本社:東京都千代田区、代表取締役社長:鵜浦 博夫、以下 NTT)は、大学共同利用機関法人 情報・システム研究機構 国立情報学研究所(所長:喜連川優、以下 NII)の人工知能プロジェクト「ロボットは東大に入れるか」※1(以下 東ロボ)に今年度より英語を対象とした共同研究に参画し、学校法人高宮学園 代々木ゼミナール(理事長 高宮英郎、本部 東京都渋谷区、以下代ゼミ)が実施した代ゼミセンター模試に挑戦した結果、受験者中の偏差値は50.5(昨年度41.0)と、常識からの推論を必要としコンピュータが最も苦手とする英語においてNTTで長年培われてきた言語処理技術、知識処理技術を活用することで、平均点を超える好成績を達成しました。
 なお、英語チームはNTTの他、岡山県立大学、秋田県立大学、大阪工業大学、電気通信大学が共同で取り組みました。
 また他教科のチームと共同による全体成績では、国公立大学4校6学部について、合格可能性が80%以上(いわゆるA判定)を得るレベルに到達しました。
 本成果は、2014年11月2日に「ロボットは東大に入れるか2014 - 東ロボくん、代ゼミ模試に挑戦 - 成果報告会」(主催 NII、場所 東京都渋谷区 代ゼミタワー)にて詳しく発表されます。

1.研究の背景・意義

 NTTのコミュニケーション科学基礎研究所※2(以下、NTTの研究所)では、機械翻訳や情報検索などに応用可能なコンピュータによる自然言語処理、知識処理の基礎研究に取り組んでいます。
 人間は社会の実際的な問題を解くために、さまざまな自然言語処理を統合的に行っています。たとえば、ある特定の話題について、文献の調査をし、レポートにまとめるといった問題は、文書の内容を理解し、それらをまとめ、文章を生成するという自然言語処理が統合的になされる必要があります。しかし、これまで基礎研究の成果は、自然言語処理の各分野で個別にしか評価されてきていません。今後、自然言語処理の技術が、より人間に役立つものとなるためには、人間が扱うような社会の実際的な問題に対して、有効性を評価していく必要があります。
 「東ロボ」プロジェクトは、センター試験や東京大学の2次試験の問題を解くことで、人工知能が、人間が実際に解く問題をどこまで解けるのかを明らかにしようとするものです。この中で、英語問題は、自然言語処理、知識処理の統合的な問題を多く含みます。たとえば、複数人による会話文を理解し、状況や、話者の意図を推定したり、ある事象に関する文章を読んで、その内容を表す文を選択したりするような問題です。このような問題を解くためには普通はどんな受け答えをするのが適切か、といった一般常識も必要です。NTTの研究所では、「東ロボ」プロジェクトに参画し、英語問題をベンチマークの一つとして用いていくことで、自然言語処理、知識処理の基礎研究およびその統合技術を高めていきます。
 今回の代ゼミセンター模試での到達点を図1 に示します。NTTチームが取り組んだ英語では大きく点数を伸ばし、95点(200点満点、昨年度52点)、受験者中の偏差値は50.5(昨年度41.0)でした。また他教科を含む全体成績では、全国の大学中、国公立大学4校6学部、私立大学472校1092学部について、合格可能性が80%以上(いわゆるA判定)を得るレベルに到達しました。

2.技術的なポイント

(1)言語モデル構築技術の適用

 文章を処理する上で重要なことは単語の並びを解釈することです。自然言語処理では、単語の並びは、言語モデル※3で表されます。NTTの研究所で培われてきた言語モデル構築の技術を、英語問題の文法・語法・語彙問題および語句整序完成問題に適用することにより、文法・語法・語彙問題では6問(10問中)、語句整序完成問題では2問(3問中)の問題に正答することができました。

(2)対話処理技術の適用

 対話文を理解し、話者の発話意図や発話内容を理解することは、音声対話エージェントにとって必須の技術であり、NTTの研究所でも長く取り組んできました。今回、話者の意図推定技術や話者の感情を推定する技術を適用することで、会話文完成問題において、1問(3問中)に正答することができ、話者同士の議論内容のまとめを問う意見要旨把握問題では、2問(3問中)に正答することができました。
 会話文完成問題の問題と解き方を図2 に例示します。4つの選択肢のそれぞれの場合について、対話文の流れとして自然かどうかを判定します。この際、発話意図(表明、同意、評価、など)の経過の自然さと感情極性(ポジティブかネガティブか)の一貫性の2つの指標を自動的に推定し選択肢ごとのスコアを算出します。そして最も大きなスコアとなる選択肢を解答として選びます。

(3)語義推定技術の適用

 文章の意味を的確にとらえるためには、書かれている語句の意味(語義と呼びます)を正確に推定する必要があります。NTTの研究所で培われてきた語義推定技術および本共同研究の取り組みにより、未知語(句)語意推測問題では、2問を完答することができました。

 これらの英語問題における技術的な前進は、岡山県立大学 磯崎秀樹教授、菊井玄一郎教授、秋田県立大学 堂坂浩二教授、大阪工業大学 平博順准教授、電気通信大学 南泰浩教授らとNTTの研究所との共同研究によるものです。なお、NTTからは、東中竜一郎主任研究員と杉山弘晃研究員が共同研究に参画しています。

3.今後の展開

 今回の結果を通じて様々な課題が明らかになりました。例えば、レビュー記事や広告といった構造を持った文書の内容を把握したり、登場人物の心情をより深く理解したりすることが必要と予想されます。また、文脈処理の要素技術は一層の進展が必要です。今後はより広い範囲の問題に対応するための基礎研究の推進とその統合を進めていきます。さらに、東ロボプロジェクトへの取り組みを通じて、文脈を理解し常識を備えた対話や翻訳を実現し、様々なサービスを実現していきます。

用語解説

※1「ロボットは東大に入れるか」
NIIの新井紀子教授を中心に、1980年以降細分化された人工知能分野を再統合することで新たな地平を切り拓くことを目的に、若い人たちに夢を与えるプロジェクトとして2011年にスタートしたもので、本プロジェクトの具体的なベンチマークとして、2016年までに大学入試センター試験で高得点をマークし、2021年に東京大学入試を突破することを目標としています。

関連リンク

※2NTTコミュニケーション科学基礎研究所
コミュニケーションの本質に応える情報通信の未来に向かって、人間科学と情報科学を融合した学際的アプローチにより新しい原理や概念を創出し、それらを革新的な情報通信サービスにつなげる基礎研究を行う研究所。
※3言語モデル
単語の並びに関する統計情報のこと。たとえば、「電信」のあとに「電話」という単語がどの程度出現しやすいかといった統計情報などが含まれる。よりよい言語モデルを持つことにより、コンピュータは誤った文章を生成しにくくなる。言語モデルは機械翻訳にとっては特に重要。
別紙・参考資料
図1 昨年度との得点比較(英語) 
図2 問題・解答の例(会話文完成問題) 

本件に関するお問い合わせ先

日本電信電話株式会社

先端技術総合研究所 広報担当
TEL:046-240-5157
E-mail: a-info@lab.ntt.co.jp

Innovative R&D by NTT
NTTのR&D活動を「ロゴ」として表現しました

「東ロボ」プロジェクトに関する問い合わせ先

国立情報学研究所

総務部企画課 広報チーム
坂内 範子
TEL:03-4212-2164
E-mail: bannai@nii.ac.jp

ニュースリリースに記載している情報は、発表日時点のものです。現時点では、発表日時点での情報と異なる場合がありますので、あらかじめご了承いただくとともに、ご注意をお願いいたします。

NTT持株会社ニュースリリース インデックスへ

サブコンテンツエリアはここからです。
  • NTT持株会社ニュースリリース内検索

 年   月 〜
 年   月 

  • NTT持株会社ニュースリリース
  • 最新ニュースリリース
  • バックナンバー
  • English is Here
  • NTT広報室 on twitter NTTグループの旬な情報をチェック!
  • Facebook NTTグループ 公式フェイスブックページ(別ウインドウが開きます)
フッタエリアはここからです。