05 Binärcodes

Beim Mystery Enträtseln begegnen einem ziemlich häufig Nullen und Eisen. Oder etwas, was verschlüsselt auf zwei Zustände herunter gebrochen werden kann: zwei verschiedene Farben oder Töne, etwas ist wahr oder falsch, etwas ist da oder weg, lang oder kurz. Oder zum Beispiel GroSsBucHstaben, wo sie nicht hingehören.

GroSsBucHstaben könnte, wenn das Großgeschriebene die 1 symbolisiert, die Binärzahl 100101001000000 ergeben.

Und dann steht man vor den Nullen und Einsen, die keineswegs immer nur Dualzahlen sein müssen. Das Beispiel oben ergäbe immerhin eine 19008, was da, wo ich wohne, eine schlüssige Nordkoordinate ergibt- wenn man sich vorn noch ein 52° herandenkt und nach der 19 einen Punkt setzt.

Die Verschlüsselung kann aber auch an einem anderen Binär-Code erfolgt sein, als dem der Dualzahlen.

Ich bemühe mich hier, einige der üblicheren Binärcodes vorzustellen.

Hilfreich bei der Suche nach dem passenden Binärcode, ist die Länge der Binärzahl. Ist sie 5 Stellen lang, oder durch 5 teilbar, könnte sie Baudot bzw. Baudot -Murray-Code sein (CCITT-1 und CCITT-2, bzw. ITA-2) . Dieser stammt aus der Zeit der Telegraphie und ist im Original geteilt in einen Bereich mit 2 Bits und einen mit 3 Bits. Hiermit lassen sich Zahlen und Buchstaben, sowie einige Sonderzeichen darstellen, Häufig finden sich in den Listings derartiger Caches Bilder von Lochstreifen, die Baudot-Code darstellen. Die größte Schwierigkeit hier ist es, herauszufinden, von welcher Seite des Lochstreifens gelesen wird und welcher Baudot/CCITT/ITA benutzt worden ist.

Nicht so richtig Nullen und Einsen, sondern die Buchstaben A und B benutzte der Herr Bacon für seine Bacon-Chiffre . Er hat einfach jedem Buchstaben im Alphabet einen fünfstelligen Code, bestehend aus den beiden Buchstaben A und B, zugewiesen.

Das Wort Mysterie in Bacon-Chiffre lautet demnach: ababb babba baaab baaba aabaa baaaa babba

Diese Codierung kann durchaus unauffällig im Text versteckt sein. Man könnte, auch wenn es etwas Mühe kostet, einen Text zusammenschreiben, bei dem die vorhandenen Buchstaben A und B Bacons Chiffre ergeben. Oder wieder die Groß- und kLeinSchReibUNG benutzen, und den GROSSGESCHRIEBENEN Buchstaben zum Beispiel das A zuweisen, den kleinen das B. Die Buchstaben könnten auch teilweise fett oder kursiv geschrieben werden, um die zwei Zustände, hier a oder b darzustellen. Möglichkeiten gibt es genug, und Mystery-Owner auch trickreich genug, beinahe unendlich viele davon zu erfinden 😉 .

BUCHSTABECODEBUCHSTABECODEBUCHSTABECODE
AaaaaaI, JabaaaRbaaaa
BaaaabKabaabSbaaab
CaaabaLababaTbaaba
DaaabbMababbU, Vbaabb
EaabaaNabbaaWbabaa
FaababOabbabXbabab
GaabbaPabbbaYbabba
HaabbbQabbbbZbabbb

ASCII ist wohl der bekannteste Vertreter der binär-Codes, von den Dualzahlen mal abgesehen. Die “American Standard Code for Information Interchange” ist eine von Computern benutzte 7-Bit-Zeichenkodierung, die schon 1963 als Standard veröffentlich wurde. Sie kann 128 Zeichen darstellen (das latainische Alphabet, arabische Ziffern, einige Satzzeichen) und wird von einer unzähligen Masse von Geräten und Programmen verstanden und unterstützt. Das überzählige achte Bit (ein Ascii-Zeichen wird üblicherweise in einem Byte gespeichert, hätte also Platz für acht Bits) wird entweder als Prüfziffer missbraucht, oder um länderspezifische ASCII-Zeichensätze darzustellen. Die deutschen Umlaute zum Beispiel.

Mit dem ASCII-Zeichensatz kann man hervorragend Caches verschlüsseln, zumal man ihn nicht nur direkt in binär, sondern auch in HEX oder Oktal darstellen kann.

BCD-Code

BCD (Binary Coded Decimal ) ist ein weiterer, bekannter Binär-Code. Es gibt ihn als 4- und als 6-Bit-Code. Der 4er ist ein 8-4-2-1-Code. Also ein nummerischer Code, dessen Wertigkeit dem bekannten Dualsystem entspricht. Es lassen sich Ziffern von 0-9 darstellen. Theoretisch könnte man 16 statt 10 Dezimalzahlen mit einem derartigen “Halbbyte” darstellen, man hat sich aber drauf geeinigt, dass man derartiges per BCD nicht tut. Ein Byte sind ja 8 Bits, also 8 Stellen, der 4-Bit-BCDCode ist somit ein halbes Byte lang. Man nennt dieses Halbbyte auch Nibble. Diesem bin ich bei einem Nachtcache tatsächlich schon begegnet.

BCD gibt es auch als 6-Bit-Code . Dieser kann neben Ziffern auch Buchstaben und einige Sonderzeichen darstellen.

Der BCD-Zählcode ist 10 Bits lang, wobei jedes Bit die Wertigkeit 1 im Dezimalsystem hat. Man bekommt die gesuchte Zahl durch plumpes addieren der Einsen. Dieses simple addieren der Einsen, anstatt kompliziert nach Codierungen zu suchen, ist etwas, was man beim Mystery-Entschlüsseln auch mal probieren könnte.

Selten aber möglich ist auch der 1-aus-n-Code, bei dem es 10 bits gibt, von denen 9 immer 0 sind und die 1 als Zähler dient. Steht sie auf der 7. Position von rechts (0001000000 ), steht sie für eine dezimale 6, steht sie auf der 2. Position von rechts (0000000010), ist sie Eins wert, ganz rechts (0000000001) ist es eine dezimale Null.

Weitere 4-Bit-Sonderformen: der Aiken-Code, bei dem die vierte Stelle von links nicht 8 wert ist, wie bei 4-Bit-BCD, sondern 2. Es ist also ein 2-4-2-1-Code. Oder der Gray-Code, den es auch als 2-Bit, 3-Bit, 4-Bit, 5-Bit und 6-Bit-Code gibt. Er zeichnet sich dadurch aus, das benachbarte Codewörter sich nur in einer einzigen dualen Ziffer unterscheiden und ist entwickelt worden, um Ablesefehler zu minimieren.

Braille, die Blindenschrift mit den kleinen Punkten, ist ebenfalls binär, also hat zwei Zustände. Es gibt ‘nen Hubbel oder es gibt keinen Hubbel. Hiermit haben mich schon mehrere Mysteries geärgert, weil ich viel zu spät und von all den Computercodierungen geblendet auf das im Format 3-hoch-2-breit geguckt hab um an das Braille-System zu denken.

Morse ist auch ein Kandidat, der eigentlich nicht so wirklich und dann wieder doch binären Codes. Es gibt zwei Zustände, nur heißen die bei Morse eigentlich lang und kurz, Punkt und Strich. Prinzipiell ist es hier aber das gleiche, irgendwo finden wir die binäre Verschlüsselung und der Schlüssel hierzu könnte das Morsealphabet sein. Allerdings hat Morse einen gravierenden Nachteil, der beim Erkennen helfen könnte: die einzelnen Zeichen sind unterschiedlich lang. Häufig benutzte Buchstaben, wie zum Beispiel das E haben kurze Morsezeichen (ein . ), lange Morsezeichen haben fünf Striche und Punkte (Sonderzeichen oft sogar sechs). Um Morse sicher übersetzen zu können, benötigt die verschlüsselte Botschaft Leerzeichen zwischen den einzelnen Zeichen. Ziffern hingegen sind bei Morse immer fünf Morsezeichen lang und dank ihres symmetrischen Aufbaus sogar relativ leicht zu erlernen.