Perfekter Code

Ein perfekter Code, oder auch dicht gepackter Code, bezeichnet in der Codierungstheorie einen Blockcode C Σ n {\displaystyle {\mathcal {C}}\subset \Sigma ^{n}} , in dem jedes Wort w Σ n {\displaystyle w\in \Sigma ^{n}} nur zu genau einem Codewort c C {\displaystyle c\in {\mathcal {C}}} (und nicht zu mehreren) einen geringsten Hamming-Abstand d w {\displaystyle d_{w}} hat, wobei d w Δ ( C ) {\displaystyle d_{w}\leq \Delta ({\mathcal {C}})} ist.

Bei der meist verwendeten Maximum-Likelihood-Decodierung bedeutet dies, dass jedes empfangene Wort w {\displaystyle w} genau ein Codewort c {\displaystyle c} hat, zu dem es den geringsten Hamming-Abstand hat und zu dem es eindeutig zugeordnet werden kann. Daraus leitet sich die Bezeichnung perfekt ab, denn es gibt keine mehrdeutigen Decodiermöglichkeiten.

Mathematische Beschreibung

Sei C Σ n {\displaystyle {\mathcal {C}}\subset \Sigma ^{n}} ein Blockcode mit | Σ | = q {\displaystyle |\Sigma |=q} , wobei Σ {\displaystyle \Sigma } das verwendete Alphabet darstellt. Alle Codeworte C {\displaystyle {\mathcal {C}}} haben untereinander einen Mindest-Hamming-Abstand von d {\displaystyle d} . Er kann damit

t = d 1 2 {\displaystyle t=\left\lfloor {\frac {d-1}{2}}\right\rfloor }

Fehler korrigieren.

Um perfekt zu sein, muss der minimale Hamming-Abstand zwischen zwei Codeworten eines Codes ungerade sein, da sonst für c 1 , c 2 C : Δ ( c 1 , c 2 ) = d {\displaystyle c_{1},c_{2}\in {\mathcal {C}}:\Delta (c_{1},c_{2})=d} mindestens ein Wort w {\displaystyle w} mit Δ ( c 1 , w ) = d 2 = Δ ( w , c 2 ) {\displaystyle \Delta (c_{1},w)={\tfrac {d}{2}}=\Delta (w,c_{2})} existiert, was im Widerspruch zur Definition perfekter Codes steht.

Da der Code t {\displaystyle t} -fehlerkorrigierend ist, kann ein Wort w Σ n {\displaystyle w\in \Sigma ^{n}} einem Codewort c C {\displaystyle c\in C} eindeutig zugeordnet werden, wenn der Hamming-Abstand d = Δ ( c , w ) t {\displaystyle d=\Delta (c,w)\leq t} ist. Umgekehrt bedeutet dies für ein bestimmtes Codewort c {\displaystyle c} , dass alle Wörter w {\displaystyle w} mit einem Hamming-Abstand von maximal t {\displaystyle t} nach c {\displaystyle c} decodiert werden. Als Menge wird dies so geschrieben:

B t ( c ) := { w Σ n Δ ( w , c ) t } {\displaystyle {\mathcal {B}}_{t}(c):=\{w\in \Sigma ^{n}\mid \Delta (w,c)\leq t\}}

Diese Menge wird auch als Kugel (manchmal auch Hyperwürfel) mit Radius t {\displaystyle t} um c {\displaystyle c} bezeichnet. Die Anzahl der Elemente von B t ( c ) {\displaystyle {\mathcal {B}}_{t}(c)} lässt sich berechnen zu:

| B t ( c ) | = i = 0 t ( q 1 ) i ( n i ) {\displaystyle |{\mathcal {B}}_{t}(c)|={\sum _{i=0}^{t}(q-1)^{i}{\binom {n}{i}}}}

Für i {\displaystyle i} Fehlerstellen gibt es i {\displaystyle i} aus n {\displaystyle n} mögliche Positionen für die Fehler. Dabei stehen pro Fehlerstelle q 1 {\displaystyle q-1} falsche Symbolwerte zur Verfügung. Es gibt | C | {\displaystyle |{\mathcal {C}}|} Kugeln. Diese sind disjunkte Teilmengen des Σ n {\displaystyle \Sigma ^{n}} . Daraus ergibt sich die Ungleichung

| Σ n | | C | i = 0 t ( q 1 ) i ( n i ) {\displaystyle |\Sigma ^{n}|\geq |{\mathcal {C}}|{\sum _{i=0}^{t}(q-1)^{i}{\binom {n}{i}}}}

Aufgelöst nach C {\displaystyle {\mathcal {C}}} und mit | Σ n | = q n {\displaystyle |\Sigma ^{n}|=q^{n}} folgt:

| C | q n i = 0 t ( q 1 ) i ( n i ) {\displaystyle |{\mathcal {C}}|\leq {\frac {q^{n}}{\sum _{i=0}^{t}(q-1)^{i}{\binom {n}{i}}}}}

Diese Ungleichung für die Anzahl der Codewörter wird Hamming-Schranke oder auch Kugelpackungsschranke genannt.

Ein perfekter Code zeichnet sich dadurch aus, dass alle Wörter w Σ n {\displaystyle w\in \Sigma ^{n}} in genau einer der Kugeln enthalten sind (anders ausgedrückt: Die Kugeln überdecken den Raum). Deshalb gilt für die Hamming-Schranke selbst die Gleichheit.

Alternative Interpretation

Man kann sich diese Grenze auch wie folgt veranschaulichen (der Einfachheit halber nur anhand binärer Codes erläutert, d. h. für q = 2 {\displaystyle q=2} ):

Für einen t {\displaystyle t} Fehler korrigierenden Code muss der Decoder genug Information erhalten, um alle folgenden Fälle unterscheiden zu können:

  • | C | = 2 k {\displaystyle |{\mathcal {C}}|=2^{k}} verschiedene Informationswörter und jeweils
  • alle möglichen Muster von 0 t {\displaystyle 0\ldots t} Bitfehlern der n {\displaystyle n} Bits eines Codewortes

Da es ( n i ) {\displaystyle {\binom {n}{i}}} Möglichkeiten gibt, i {\displaystyle i} Bitfehler auf n {\displaystyle n} Bits zu verteilen, ergeben sich insgesamt

2 k i = 0 t ( n i ) {\displaystyle 2^{k}\cdot \sum _{i=0}^{t}{\binom {n}{i}}}

Fälle, die mit den zur Verfügung stehenden n {\displaystyle n} Bits unterschieden werden müssen, also

2 n 2 k i = 0 t ( n i ) {\displaystyle 2^{n}\geq 2^{k}\cdot \sum _{i=0}^{t}{\binom {n}{i}}} .

Bei einem perfekten Code gilt Gleichheit, das heißt die n {\displaystyle n} Bits tragen exakt die minimal benötigte Information. Diese (Un-)Gleichung entspricht der obigen allgemeinen Definition für den Fall q = 2 {\displaystyle q=2} und | C | = 2 k {\displaystyle |{\mathcal {C}}|=2^{k}} .

Man ist zwar eigentlich nur an der Korrektur der k {\displaystyle k} Informationsbits interessiert, wofür entsprechend weniger Zusatzinformation genügen würde – diese n k {\displaystyle n-k} Bits Zusatzinformation müssten dann aber fehlerfrei sein, was natürlich in der Regel nicht gewährleistet ist. Daher ist eine Korrektur aller n {\displaystyle n} Bits erforderlich.

Bekannte Perfekte Codes

Falls die Alphabetgröße q {\displaystyle q} eine Primzahlpotenz ist, so gilt:

Ist C {\displaystyle {\mathcal {C}}} ein perfekter Code mit Parametern [ n , k ; d , q ] {\displaystyle [n,k;d,q]} mit k = l o g q ( | C | ) {\displaystyle k=\mathrm {log} _{q}(|{\mathcal {C}}|)} , so gibt es einen Code  D {\displaystyle {\mathcal {D}}} mit denselben Parametern, so dass D {\displaystyle {\mathcal {D}}} einer der folgenden Codes ist[1][2]:

  • Ein trivialer Code: Ein Code heißt hier trivial,
    • falls er entweder nur q 0 = 1 {\displaystyle q^{0}=1} , d. h. ein einziges Codewort enthält: [ m , 0 ; 2 m + 1 , q ] {\displaystyle [m,0;2m+1,q]} oder
    • falls er alle q m {\displaystyle q^{m}} möglichen Codewörter der gegebenen Blocklänge enthält: [ m , m ; 1 , q ] {\displaystyle [m,m;1,q]} .
  • Ein binärer Wiederholungs-Code mit ungerader Codewortlänge. Die Parameter lauten [ 2 m + 1 , 1 ; 2 m + 1 , 2 ] {\displaystyle [2m+1,1;2m+1,2]} .
  • Ein Hamming-Code über dem endlichen Körper F q {\displaystyle \mathbb {F} _{q}} , mit Parametern [ q m 1 q 1 , q m 1 q 1 m ; 3 , q ] {\displaystyle \;\left[{\frac {q^{m}-1}{q-1}},{\frac {q^{m}-1}{q-1}}-m;3,q\right]} .
  • Der binäre Golay-Code G 23 {\displaystyle {\mathcal {G}}_{23}} mit Parametern [ 23 , 12 ; 7 , 2 ] {\displaystyle [23,12;7,2]} .
  • Der ternäre Golay-Code mit Parametern G 11 {\displaystyle {\mathcal {G}}_{11}} mit [ 11 , 6 ; 5 , 3 ] {\displaystyle [11,6;5,3]} .

m {\displaystyle m} steht hierbei jeweils für eine positive natürliche Zahl m N + {\displaystyle m\in \mathbb {N} ^{+}} .

Die Codes C {\displaystyle {\mathcal {C}}} und D {\displaystyle {\mathcal {D}}} haben die gleichen Parameter und können somit bei gleicher Blocklänge  n {\displaystyle n} gleich viele Fehler korrigieren. Die Umwandlung eines trivialen Codes in einen linearen Code mit denselben Parametern ist einfach: Falls der Code ein einziges Codewort enthält, so kann stattdessen auch der Nullvektor c 0 = ( 0 , , 0 ) {\displaystyle c_{0}=(0,\dots ,0)} als einziges Codewort dienen, und der entstandene Code ist linear. Der einzige verbleibende triviale Code ist derjenige, der sämtliche q n {\displaystyle q^{n}} möglichen Wörter der gegebenen Blocklänge enthält. Dieser ist aber bereits linear. Bei den restlichen Codes aus der Liste handelt es sich bereits um lineare Codes. Es gibt für jeden perfekten Code, der im Allgemeinen kein linearer Code ist, einen linearen Code mit den gleichen Parametern – sofern die Größe des Alphabetes eine Primzahlpotenz ist.

Es ist offen, ob, und für welche Parameter es nicht triviale perfekte Codes gibt, falls die Alphabetgröße keine Primzahlpotenz ist.

Für praktische Zwecke sind die trivialen Codes uninteressant, da entweder

  • keine Information übertragen werden kann oder
  • keine Fehler erkannt oder korrigiert werden können.

Einzelnachweise

  1. F.J. MacWilliams, N.J.A. Sloane: The Theory of Error-Correcting Codes. North-Holland, Amsterdam 1977
  2. Werner Lütkebohmert: Codierungstheorie. Vieweg, Braunschweig / Wiesbaden 2003