01 Décryptage manuel des cryptogrammes

Les chiffrages monoalphabétiques simples, où chaque lettre de l’alphabet se voit simplement attribuer une lettre, un caractère ou une chaîne de chiffres différents, peuvent être déchiffrés en relativement peu de temps à l’aide d’une feuille de papier, d’un tableau des fréquences des lettres de la langue et d’un peu de temps.

En fait, plus le texte chiffré est long, plus il est facile de le déchiffrer grâce à la fréquence des lettres, à la fréquence des mots, aux terminaisons des mots et aux compétences linguistiques.

La première chose à faire est de compter les caractères du texte chiffré et de les trier par fréquence. Si vous avez (selon la longueur du texte) environ 20-27 caractères différents, vous avez presque certainement un alphabet crypté simple (26 caractères) plus des espaces et éventuellement un ou deux signes de ponctuation (point, virgule et pour les géocacheurs peut-être un signe de degré). S’il s’agit d’environ 55 caractères, il est possible que des majuscules et des minuscules aient été utilisées, éventuellement aussi des trémas allemands. S’il y a environ 10 caractères en haut, il peut aussi y avoir des chiffres dans le texte.

Bien sûr, il existe sur Internet des aides volontaires qui se chargent de compter et de trier à votre place, et même de décrypter dans de nombreux cas. Une distribution de fréquence peut être faite très joliment sur cryptool-online et kas-bc.de.

Sur la page Cryptool, vous trouverez, comme dans l’article de Wikipedia, le tableau avec les fréquences des lettres de la langue allemande et anglaise. Il existe également la “montagne de fréquences”, qui est très utile si vous voulez reconnaître visuellement les chiffres de rotation. Ainsi, la forme de chiffrement des lettres, où l’alphabet est seulement décalé de x chiffres. Avec César et son code il y en avait 3 (un “A” devient un “C”, un “B” devient un “D”, …), aujourd’hui le 13 est utilisé très souvent (ROT13), ce qui a le charme qu’on arrive avec un saut supplémentaire de 13 caractères dans l’alphabet de nouveau au texte source. Le décryptage et le cryptage sont donc possibles de la même manière. Il convient de souligner qu’un chiffrement rotatif n’est en aucun cas un chiffrement de quelque nature que ce soit, c’est-à-dire qu’il ne doit jamais être utilisé pour dissimuler des informations qui doivent réellement rester secrètes. Il s’agit plutôt d’un gadget, où un texte n’est pas immédiatement lisible.

La distribution des caractères donne-t-elle des “oscillations” similaires à celles de la distribution des lettres dans les tableaux ? Un ou deux caractères doivent apparaître très fréquemment, l’espace (s’il a été codé) étant généralement le caractère le plus fréquent. Mais on peut aussi l’omettre, auquel caslesmotsnesontplusaussifacilesàlire. Tout près du caractère espace, on trouve la lettre “E”, qui occupe environ 17% des lettres dans les textes allemands moyens.

Même dans mon très petit échantillon d’encodage, la fréquence relative des “E” est correcte.

Le texte chiffré tuxjlaktlfckokotyfckojxkobokxlaktl ne comporte que 12 lettres différentes, mais c’est parce qu’il est très court. La lettre la plus courante est le “K”, avec environ 20%. Si nous supposons que c’est le E, nous avons peut-être déjà déchiffré un cinquième du texte chiffré et, surtout, un point de départ pour la compétence linguistique et les combinaisons typiques de lettres ou les terminaisons de mots.

Ainsi, en plus des tableaux pour les fréquences des lettres, il y en a aussi avec les terminaisons des lettres les plus fréquentes. Voici le plomb en langue allemande : “en, em, es, el und er, st, ing, sam, bar, lich, ung, heit, keit”.

Les bigrammes les plus fréquents, c’est-à-dire les paires de lettres qui apparaissent ensemble en allemand, sont également intéressants : “en, er, ch, ck, (où le c seul n’apparaît presque jamais), te, de, nd, ei, ie, in, es”. Et les trigrammes (les trois lettres qui se suivent le plus fréquemment) : “ein, ich, nde, die, und, der, che, end, gen, sch”.

Il convient également d’examiner les mots les plus fréquemment utilisés en allemand. Ce palmarès est mené par “der, die, und, in, den, von, zu, das, mit, sich, des, auf, für, ist, et im”. Pour les géocacheurs, cette liste de résultats change probablement un peu, avec les mots “Nord, Ost, Grad, Cache, Koordinaten, Dose, suchen, Versteck” et les chiffres écrits : “eins, zwei, drei, vier, fuenf/fünf, sechs, sieben, acht, neun und null” glissant plus haut dans la liste.

À propos, il n’existe pas de mots d’une seule lettre en allemand, ce qui rend les textes allemands très différents des textes anglais.

Pour le décryptage manuel de textes chiffrés simples, j’utilise un éditeur de texte (le gratuit Notepad++). Tout programme de traitement de texte fonctionne aussi bien, mais vous devez choisir une police dont les lettres ont une largeur fixe (par exemple Courier New ou monospace). De cette façon, le texte chiffré et la tentative de déchiffrement peuvent être placés directement l’un en dessous de l’autre.

Dans l’exemple de juste tuxjlaktlfckokotyfckojxkobokxlaktl

En supposant que le texte a été codé sans espaces (puisqu’il n’y a qu’une seule lettre très courante) et que la plus courante est en fait le “E”, j’écris ces résultats sous le texte chiffré.

Malheureusement, il n’est pas encore lisible. Mais peut-être que ce qui a permis de briser le cou de nombreux cryptogrammes historiques fonctionnera ici : vous pourrez peut-être deviner comment le texte commence, ou quels mots il contient. Même pendant la Seconde Guerre mondiale, de nombreux chiffres ont été déchiffrés, car des salutations typiques, les mêmes phrases et des mots facilement devinables étaient utilisés.

Dans notre cas, un chiffrement typique pour le geocaching, nous supposons qu’il s’agit d’une coordonnée. Elle commence généralement par North ou N. Le “T”, la première lettre du texte chiffré, représente 12 % de ce chiffre, ce qui correspond bien à la fréquence statistique habituelle d’environ 10 % du “N”. Essayons-le :

Eh bien, ce n’est pas encore vraiment lisible, alors continuez. Mais comment ? Tu peux deviner plus de lettres maintenant. Le deuxième plus commun dans le texte chiffré est un “O”, le troisième est un “L”. Si l’on prend les tableaux de fréquence des lettres, les lettres E N I S R et A sont les plus courantes. Ainsi, O et L devraient en faire partie. Puisque “E” et “N” ont probablement déjà été trouvés, seuls I, S, R et A manquent.

Vous pouvez également deviner des mots. Le texte chiffré commence-t-il vraiment par Nord ? Le “U” du texte chiffré serait alors un “O” et le “X”, qui apparaît trois fois dans le texte chiffré et correspondrait à un “R”, serait encore plus utile.

Le texte se termine par en et une autre lettre, encore inconnue. Quelle pourrait être une fin plausible ici ? S’agit-il d’un chiffre écrit ? Lequel se termine par en et une autre lettre ? Si c’est le cas, cinq ou cinq serait un candidat approprié. Si le crypteur a choisi la notation ue pour éviter de crypter les trémas allemands, alors s’il s’agit vraiment de cinq, la cinquième lettre en partant du fond devrait correspondre à la dernière. Bingo ! “laktl”, ce sont les cinq dernières lettres. Et cela signifie certainement “fuenf”.

Mais nous pourrions aussi choisir l’approche de la montagne de fréquences. Si le texte chiffré n’est qu’un décalage ROT (décalage de l’alphabet de x chiffres), la visibilité devrait peut-être déjà être visible ici, même avec si peu de lettres.

Et en effet, les grandes barres semblent se répéter avec un espacement similaire en haut et en bas.

Les E, I et N de l’alphabet normal pourraient correspondre aux barres K, O et T du texte chiffré.

Cette “montagne de fréquences” serait beaucoup plus significative si le texte chiffré était plus long. Mais même avec ce court extrait, cela pourrait être suffisant et nous voyons un changement de 6 lettres. C’est également la suggestion que cryptoolonline nous ferait ici si nous cliquions sur le bouton approprié “ROT check”.

Und eigentlich hätte man dies schon ein paar Schritte vorher ausprobieren können, da der Buchstabe „E“ (im Geheimtext „K“) und „N“ (im Geheimtext „T“) ja schon erraten worden sind. Beide sind um 6 Buchstaben verschoben, somit kann man immerhin schon hoffen, dass alle Buchstaben um 6 verschoben worden sind.

Mais quelle que soit la méthode choisie, avec un peu de pratique, il suffit de quelques minutes pour obtenir le texte original nordfuenfzweieinszweidreivierfuenf à partir du texte chiffré tuxjlaktlfckokotyfckojxkobokxlaktl.

Même si l’alphabet a été complètement brouillé (au lieu d’être décalé de x chiffres), le décryptage ne prend qu’un peu plus de temps. Il existe toujours une approche simple qui consiste à identifier l’espace et le “E” par l’analyse des fréquences. Dans les textes plus longs, recherchez toujours les points et les virgules, qui ne sont jamais au début d’un mot mais sont toujours suivis d’un espace. Ensuite, essayez de décoder les mots courts (le, la, les, et, dans, dans, …) et cherchez des passages de texte identiques qui signifient les mêmes mots ou les mêmes parties de mots.

Les caractères identiques dans une rangée sont également un bon point de départ, car en allemand, seules certaines lettres apparaissent deux fois et elles sont souvent entourées de lettres identiques ou similaires. Les consonnes doubles ont toujours des voyelles, les voyelles doubles ont toujours des consonnes autour d’elles. Et bien sûr, vous devez toujours rechercher les salutations typiques (“Cher Cacher, …”) et les adieux (“Amusez-vous bien dans vos recherches”).

Et bien sûr, l’assistant GC ne devrait pas manquer. Dans la section “General Code Solvers”, il existe également un outil permettant de craquer les codes de substitution monoalphabétiques au moyen d’une analyse de fréquence 😉

Si l’approche avec l’analyse de fréquence ne fonctionne pas, c’est-à-dire qu’aucun caractère du texte chiffré ne ressort de manière évidente, il ne s’agit pas d’un chiffrement monoalphabétique mais peut-être d’un changement de lettres répété, où l’alphabet de la clé a été changé tous les x caractères. Il est également possible de le décrypter à la main avec un peu d’effort, mais c’est déjà beaucoup plus laborieux. L’important ici est de découvrir, par le biais de passages identiques de textes chiffrés, après combien de lettres l’alphabet change – et à quelle fréquence.

Un autre lien permettant de décoder des messages chiffrés à l’aide d’un tableur et de convertir et comparer des valeurs ascii se trouve sur le site Mathebord.