誤り検出と訂正

学習のポイント

キーワード

ＥＣＣチェックデジット、パリティチェック、ＣＲＣ方式、ハミング符号

ＥＣＣ

ＥＣＣ（Error-Correcting Code：誤り訂正符号）とは、データを記録・伝送する際に発生する誤りを受け手の側で検出し、訂正することができるように付加される符号、あるいは、その方式の総称です。
　符号を長くすれば検出・訂正できる誤りも増えます。しかし、符号ビットによる容量の増大や計算量の増大が必要となります。誤りの発生率、訂正手段、コストなどを勘案して適切なものが選ばれます。
　メモリ自体にパリティチェックを行う機構を組み込んだＥＣＣ機能付きメモリも使われています。

チェックデジット

長い数字列のコードの場合は入力誤りをしがちです。それで、コードの末尾に１桁のチェック用の桁をもうけておき、例えばコードの各桁を加算したときの１の位の数字を入れておき、コード入力したときに計算をして、答が合致するかどうかをチェックする方法があります（実際には後述のような複雑な計算をします）。そのチェック用の桁をチェックデジットといいます。
　ＰＯＳシステムではＪＡＮコード（バーコード）をスキャンしますが、読み取りエラーを防ぐために、ＪＡＮコードにはチェックデジットがつけられています。

ＪＡＮコードは１２桁のコードと１桁のチェックデジットからできています。次の手順によりチェックデジットを計算します（モジュラス10、ウエイト1、3の計算方法）。
　１２桁のコード部分を「4 9 1 0 1 2 3 4 5 0 6 4 」とします。

4 + 1 + 1 + 3 + 5 + 6 = 20 桁に当たるコードの数字を加算する。　　9 + 0 + 2 + 4 + 0 + 4 = 19
その結果を３倍する。　　１９×３＝５７
コードの奇数桁を加える。　　4 + 1 + 1 + 3 + 5 + 6 = 20
それらの結果を加える。　５７＋２０＝７７
１０から末尾の数を引く。　１０－７＝３
その結果をチェックデジットとする。　チェックデジット＝３

垂直パリティチェック方式

キャラクタ単位に、誤りがないかチェックする方式です。送信時にキャラクタ内の１の個数がすべて偶数個（偶数パリティといいます。すべて奇数にするなら奇数パリティです）になるように，１ビットのパリティビットを付加して送信します。受信側で１のビット数を数えることにより誤りの検出ができます。簡単な方法であり，奇数個の誤りは検出できますが，偶数個の誤り時には検出できません。また訂正はできません。

水平垂直パリティチェック方式

水平パリティチェック方式ともいいます。ブロックについて，キャラクタの各ビット桁の１の数が偶数（奇数）になるようにＢＣＣ（Block Check Character）を付加します。水平と垂直のパリティチェックを組み合わせることにより、
・１ビットの誤り：誤り個所がわかるので正しく訂正できる
・２ビット以上の誤り：誤りの検出はできるが訂正はできない（誤り箇所が特定できない）
ができます。

ここでは話を簡単にするために、４ビットのデータを４件送信することとし、偶数パリティにします。
　データに水平パリティ符号と垂直パリティ符号による次のビット列が送られたとします。
　　　　１０００～１１０１１０１１０００１
　　　　└───┬───┘└┬─┘└┬─┘
　　　　　　　データ　　　　│　　　└垂直パリティ符号
　　　　　　　　　　　　　　└水平パリティ符号
　送られたビット列から、改めてデータ部分から１の個数を計算し、偶数なら０、奇数なら１とします。

正しく送られたときは、次図のように、パリティ符号列と計算値列が一致します。
　　　　　　　　　符号　計算値
　　　　　１０００　１　　１
　　　　　０１１０　０　　０
　　　　　００１０　１　　１
　　　　　１１０１　１　　１

　符号　　０００１
　計算値　０００１

次の赤字の１ビットに誤りが生じたときは、その位置の水平および垂直でパリティ符号と計算値が不一致になるので、誤りを検出するとともに正しく訂正できます。
　　　　　　　　　符号　計算値
　　　　　１０００　１　　１
　　　　　０１１０　０　　０
　　　　　０１１０　１　　０←不一致
　　　　　１１０１　１　　１

　符号　　０００１
　計算値　０１０１
　　　　　　↑
　　　　　不一致

２ビットに誤りが生じたとき、例えば下左図のように垂直でパリティ符号と計算値が不一致になることから誤りを検出できます。しかし、下右図でも同じ不一致結果になるので、誤り箇所が特定できず、訂正はできません。
　　　　　　　　　符号　計算値　　　　　　　　　　　　　　符号　計算値
　　　　　１０００　１　　１　　　　　　　　　　　１０００　１　　１
　　　　　０１１０　０　　０　　　　　　　　　　　０１１０　０　　０
　　　　　０１１０　１　　０←不一致　　　　　　　１０１０　１　　０←不一致
　　　　　０１０１　１　　０←不一致　　　　　　　１００１　１　　０←不一致

　符号　　０００１　　　　　　　　　　　　符号　　０００１
　計算値　１１０１　　　　　　　　　　　　計算値　１１０１
　　　　　↑↑　　　　　　　　　　　　　　　　　　↑↑
　　　　　不一致　　　　　　　　　　　　　　　　　不一致

なお、ここではデータ部分の誤りを対象にしましたが、水平パリティ符号列の垂直パリティ符号も送ることにより、パリティ符号の誤りもチェックできます。

ＣＲＣ方式(Cyclic Redundancy Check)

巡回符号検査方式ともいいます。送信データをビット列を多項式として，それを決められた生成多項式（１６ビットの生成多項式はＸ^１６＋Ｘ^１２＋Ｘ^５+１）で割り，その余りのビット列を付加します。受信側ではその逆算を行って誤りを検出します。非常に高い精度での誤り検出が可能です。特に通信では連続的にビット誤りが発生します。それをバースト誤りといいますが，その検出に効果的です。ＣＲＣはＨＤＬＣでの誤り制御に採用されているので，ＬＡＮやインターネットで広く用いられている方法です。

ＣＲＣの説明はかなり面倒ですので，簡単な例題で説明します。

　例えば，送信するべきビット列を１１１１，生成多項式をＧ(Ｘ)＝Ｘ^３＋Ｘ＋１とします。すると，

　　　Ｘ^３　Ｘ^２　Ｘ　　１　　　Ｘ^６　Ｘ^５　Ｘ^４　Ｘ^３　Ｘ^２　Ｘ　　１
　　　　　　　　　　　　　　　　１　　１　　　　　１　　　　　　　　　.
　　　１　　０　　１　　１　）　１　　１　　１　　１　　　　　　　　　
　　　　　　　　　　　　　　　　１　　０　　１　　１　　　　　　　　　.
　　　　　　　　　　　　　　　　　　　１　　
　　　　　　　　　　　　　　　　　　　１　　０　　１　　１　　　　　　.
　　　　　　　　　　　　　　　　　　　　　　　　　１　　１
　　　　　　　　　　　　　　　　　　　　　　　　　１　　０　　１　　１
　　　　　　　　　　　　　　　　　　　　　　　　　　　　１　　１　　１

となります（ここで０－１が－１ではなく，＋１になっていますが，気にしないでください）。

余りがＸ^２＋Ｘ＋１ですので，付加するビットは１１１になり，これを検査ビット（ＦＣＳ）といいます。

　受信側にデータ１１１１とＦＣＳ１１１が送られてきたときは，
　　　Ｘ^３　Ｘ^２　Ｘ　　１　　　Ｘ^６　Ｘ^５　Ｘ^４　Ｘ^３　Ｘ^２　Ｘ　　１
　　　　　　　　　　　　　　　　１　　１　　　　　１　　　　　　　　　.
　　　１　　０　　１　　１　）　１　　１　　１　　１　　１　　１　　１　　　　　　
　　　　　　　　　　　　　　　　１　　０　　１　　１　　　　　　　　　.
　　　　　　　　　　　　　　　　　　　１　　０　　０　　１　　１　　１
　　　　　　　　　　　　　　　　　　　１　　０　　１　　１　　　　　　.
　　　　　　　　　　　　　　　　　　　　　　　　　１　　０　　１　　１
　　　　　　　　　　　　　　　　　　　　　　　　　１　　０　　１　　１
　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　０
となり，割り切れますので，誤りがなかったことがわかります。

　１１０１１１１が送られてきたときは，
　　　Ｘ^３　Ｘ^２　Ｘ　　１　　　Ｘ^６　Ｘ^５　Ｘ^４　Ｘ^３　Ｘ^２　Ｘ　　１
　　　　　　　　　　　　　　　　１　　１　　１　　１　　　　　　　　　.
　　　１　　０　　１　　１　）　１　　１　　０　　１　　１　　１　　１　　　　　　
　　　　　　　　　　　　　　　　１　　０　　１　　１　　　　　　　　　.
　　　　　　　　　　　　　　　　　　　１　　１　　０　　１　　１　　１
　　　　　　　　　　　　　　　　　　　１　　０　　１　　１　　　　　　.
　　　　　　　　　　　　　　　　　　　　　　１　　１　　０　　１　　１
　　　　　　　　　　　　　　　　　　　　　　１　　０　　１　　１　　　.
　　　　　　　　　　　　　　　　　　　　　　　　　１　　１　　０　　１
　　　　　　　　　　　　　　　　　　　　　　　　　１　　０　　１　　１
　　　　　　　　　　　　　　　　　　　　　　　　　　　　１　　１　　０
となり，割り切れないので，誤りがあることがわかります。

ハミング符号

（ここでは、理解を容易にするため、厳密性を欠いた説明にしています）

ハミング符号とは，情報ビットに冗長ビットを付加して，２ビットの誤り検出と１ビットの誤り訂正機能をできるようにしたものです。自動訂正機能に採用されています。
　４ビットＸ_１，Ｘ_２，Ｘ_３，Ｘ_４を送りたいとします。そのとき，冗長ビットとして，

　　　Ｘ_１　　＋Ｘ_３＋Ｘ_４＋Ｐ_１　　　　＝偶数
　　　Ｘ_１＋Ｘ_２　　＋Ｘ_４　　＋Ｐ_２　　＝偶数
　　　Ｘ_１＋Ｘ_２＋Ｘ_３　　　　　　＋Ｐ_３＝偶数

となるようなＰ_１，Ｐ_２，Ｐ_３の３ビットを付加して，Ｘ_１Ｘ_２Ｘ_３Ｘ_４Ｐ_１Ｐ_２Ｐ_３を送るのです。

たとえば，１０１１を送るのであれば，

　　　１　　＋１＋１＋Ｐ_１　　　　＝偶数
　　　１＋０　　＋１　　＋Ｐ_２　　＝偶数
　　　１＋０＋１　　　　　　＋Ｐ_３＝偶数

から，Ｐ_１＝１，Ｐ_２＝０，Ｐ_３＝０ですので，１０１１１００として送ります。

もし，１１１００１１を受け取ったとします。

　　　Ｘ_１　Ｘ_２　Ｘ_３　Ｘ_４　Ｐ_１　Ｐ_２　Ｐ_３
　　　１　　１　　０　　０　　１　　１　　１
　　　１　　　　＋０　＋０　＋１　　　　　　　＝偶数　（ａ）
　　　１　＋１　　　　＋０　　　　＋１　　　　＝奇数　（ｂ）
　　　１　＋１　＋０　　　　　　　　　　＋１　＝奇数　（ｃ）

なので，ｂとｃの両方にあってａにない変数Ｘ_２が誤りで，１を０にする必要があること，すなわち，送信元は１０１０を送ったのだということがわかります。

理解度チェック

過去問題：「誤りの検出と訂正」