グローバルスタンダード最前線

通信装置のソフトエラー対策、ITU-T国際標準制定

PDFダウンロードPDFダウンロード

岩下 秀徳(いわした ひでのり)


NTTネットワークサービスシステム研究所

2018年11月、ITU-T(International Telecommunication Union - Tele-communication Standardization Sector)にて、通信装置のソフトエラー対策に関する勧告が承認されました。本勧告は、地上に降り注ぐ宇宙線を主たる原因とする通信装置の誤動作(ソフトエラー)の対策について、設計方法・試験方法・評価方法および品質基準を定めた勧告で、ソフトエラーに関する一連の対策・評価基準を定義したものです。本標準勧告により、ソフトエラー対策の基準に基づいたさらなるネットワークの信頼性確保が期待できます。ここでは、通信装置のソフトエラー対策に関する勧告について紹介します。

通信装置のソフトエラー

近年、宇宙線によって生じる中性子線によるソフトエラーが地上で使用する通信装置でも増加しつつあります。ソフトエラーとは、永久的に半導体デバイスが故障してしまうハードエラーとは異なり、電気的ノイズによって発生する故障(メモリのビット反転)で、半導体デバイスの再起動やデータの上書きによって回復可能な故障のことです。保存されているデータが一時的に書き換わることで誤動作やシステムダウンを引き起こす可能性がある一方で、再起動・上書きで回復してしまい、事象の再現や原因特定が困難といわれています。発生すると利用者に多大な影響を及ぼす可能性がありますが、運用者にとっても原因究明・対策が大きな負担となる場合があります。通信装置では、このような故障も想定して通信サービスに影響を及ぼさないように設計しますが、ソフトエラーを再現させるためには、大学や研究機関が保有する大型加速器を用いる必要があり、商用装置を開発段階で十分に検証をすることができませんでした。
しかしながら、最近、一般企業が保有する数メートル程度の小型加速器中性子源*1を用いて通信装置のソフトエラーによる影響を測定することができるようになりました(1)。本試験を実施することにより、事前にソフトエラーの影響を把握でき、改善を行ったうえで製品を販売する、実運用ネットワークへ通信装置を導入することもできるようになってきました。開発・導入段階でのソフトエラー対策により、大幅な通信品質の向上を図ることも可能となりますが、その手法・評価について指標となる基準が求められていました。

ソフトエラー対策に関するITU-T勧告

このような背景から、ソフトエラー対策に関する設計から評価、品質基準を定めることを目的に、2015年8月に一般社団法人情報通信技術委員会に通信装置のソフトエラー対策に関する標準化Adhoc(SOET Adhoc:Soft Error Testing Adhoc)が開設(2)され、2015年10月のITU-T(International Telecommunication Union - Telecommunication Standardization Sector)SG(Study Group)5*2会合において、通信装置のソフトエラー対策に関する検討プログラムの開始が承認され、SOET Adhoc委員各社が中心となり勧告草案の作成を行い、このたび勧告化が実現しました。
この勧告では、ソフトエラー対策に関する設計方法・試験方法・評価方法および品質評価基準が定義されており、求められる信頼性のレベルに応じたソフトエラー対策を可能にする指標が示されています。
ITU-Tで承認されたソフトエラー対策勧告は、5つの勧告本編と補足資料で構成されています。ソフトエラー対策勧告の全体像を図1に、勧告一覧を表1に示します。勧告化までの経緯を表2に示します。

図1 ソフトエラー勧告の全体

図1 ソフトエラー勧告の全体

表1 ソフトエラー勧告一覧(3)〜(6)

表1 ソフトエラー勧告一覧

表2 ソフトエラー対策標準化勧告の年表

表2 ソフトエラー対策標準化勧告の年表

K.124(概要編)通信装置の粒子放射線影響の概要

本勧告は、ソフトエラーが発生するメカニズム、通信装置で発生するソフトエラーの影響と対策の概要、ソフトエラーに対する標準の必要性について述べています。ソフトエラーが発生する主な要因には、半導体デバイスに微量に含まれる放射性同位元素から生成されるα線と、宇宙線によって生成される中性子線があります。α線によるソフトエラーに対する影響は高純度材料(低α線樹脂等)を採用することによって低減することができます。
宇宙線によるソフトエラーは以下の要因で発生します。宇宙では太陽や超新星爆発によって、陽子を主体とした高エネルギー粒子が飛び交っています。この高エネルギー粒子が地球の大気に突入すると、大気中の窒素原子核や酸素原子核と衝突し、核反応が起きます。このとき、原子核内部にあった中性子が飛散します。大気中で発生した中性子の大部分は通常、半導体デバイスに突入しても透過し、何ら影響を与えませんが、まれに半導体デバイスを構成するシリコン原子核と核反応を起こし、電荷を持ったさまざまな粒子を発生させます。これが電気的なノイズとなり、一時的なエラーであるソフトエラーを発生させます。

K.130(試験編)通信装置のソフトエラー試験手法

本勧告は、加速器中性子源を用いて通信装置のソフトエラーを発生させる方法と試験手順について述べています。加速器により加速された粒子(陽子・電子)をターゲット(鉛、タングステン、ベリリウム、リチウム等)に照射すると核反応が起き、中性子が発生します。この中性子を通信装置に照射することにより、自然界の数百万倍から数億倍の中性子を照射することができ、短時間でソフトエラーを再現させることができます。

K.131 (設計編)通信装置のソフトエラー対策設計手法、K Suppl.11(補足編)K.131補足資料-FPGAのためのソフトエラー対策

本勧告は、キャリア通信ネットワークを構成する通信装置に対するソフトエラー対策設計手法について述べています。はじめに、ソフトエラー対策の観点から対象となる通信装置の基本構成、ソフトエラーに対する信頼度規定定義と規定方法および信頼度規定に適合するためのソフトエラー対策の装置開発手順について述べています。また、特に対策が重要となるFPGA(Field Programmable Gate Array)についてはK.131の補足資料としてK Suppl.11 FPGAのためのソフトエラー対策に、FPGAのソフトエラー発生率の傾向、ソフトエラーの影響の低減方法について詳細に述べています。

K.139(基準編)通信装置の粒子放射線影響の信頼性要求基準

本勧告は、高信頼のネットワークを構築するために必要なソフトエラーに対する信頼性の基準について述べています。ここでは、基準の考え方について紹介します。半導体デバイスの高集積化に伴い、ハードエラーに対してソフトエラーが急増していますが、ソフトエラーはハードエラーとは異なり、対策によって大幅にトラブルを低減することができます。そこで、従来から発生しているハードエラーを基準として、ソフトエラー起因の故障交換数、主信号断の発生率が統計誤差に収まる範囲をそれぞれの目標基準に設定しました。ただし、ソフトエラーによってまれに誤動作を検出できないサイレント故障が発生する可能性があります。サイレント故障は発生が許容されないので、約1万年分相当の中性子線を照射してもサイレント故障が発生しないことを信頼性基準として設定しました。このように故障交換率、主信号断発生率の低減、サイレント故障を防ぐための3つの信頼度基準を定義し、クラスを設定しました(図2)。この基準を満たすことで、大規模ネットワークを構築した場合の信頼性を確保できます。

K.138(評価編)粒子放射線検査に基づく対策のための品質推定方法とアプリケーションガイドライン

本勧告は、K.130(試験編)に記載の中性子照射試験で得た結果を基に、K.139(基準編)に定義されている通信装置のソフトエラーに対する各信頼度規定が満たされているかを評価する方法について述べています。K.130に記載されている試験では自然界の数百万倍から数億倍の強度で中性子を照射することで、短時間でソフトエラーを再現させることができます。評価の例を図3に示します。まず、中性子線を照射しソフトエラーを発生させます。測定器により主信号状態、警報監視端末により警報発生状態を確認し、発生した事象を「3つの信頼度基準」へ分類します。例えば、1回目のソフトエラーでは装置警報が発生し、主信号が切れました。この場合は、保守交換が必要と想定されるのでMR(Maintenance Reliability)に該当する事象としてカウントします。また、主信号断も発生しましたので、SR(Servicee Reliability)に該当する事象とカウントします。次に2回目のソフトエラーは自動訂正が働き、装置警報もなく主信号影響もありませんでした。この場合は、どの信頼度にもカウントされないということになります。このように、試験では主信号影響と、装置警報状態を確認します。そして8回目のソフトエラーでは、装置警報がない状態で、主信号断が継続しているので、これはサイレント故障に該当し、AR(Alert function Reliability)が1回とカウントできます。このように各信頼度基準に該当する事象をカウントします。さらに、照射時間から換算した自然界稼動時間と発生頻度から基準値を満たすかどうか判定することができます。

図2 3つの信頼度基準と基準値

図2 3つの信頼度基準と基準値

図3 評価の例

図3 評価の例

今後の展開

本勧告の基準を満たした通信装置が普及することにより、通信サービスの信頼性向上が期待されます。

■参考文献

ページトップへ