Wat is ASCII en Unicode (UTF-8) en hoe werkt deze functie?

ASCII, Unicode en UTF-8 zijn manieren om tekst digitaal te coderen. ASCII gebruikt 128 tekens, zoals Engelse letters en cijfers. Unicode heeft veel meer tekens en kan bijna alle talen en symbolen weergeven. UTF-8 slaat Unicode-tekens op een slimme manier op, zodat het ook nog steeds met ASCII werkt.

Hoe is ASCII, Unicode en UTF-8 ontstaan?

ASCII was de eerste standaard die werd geïntroduceerd in 1968 voor eenvoudige Engelse tekst. Het definieert 128 tekens die kunnen worden weergegeven door 7 bits.

Er ontstond de behoefte om recht te doen aan verschillende talen. In 1991 werd Unicode geïntroduceerd, die tot 32 bits per teken gebruikt en daardoor meer dan 4 miljard tekens kan onderscheiden.

In 1993 werd UTF-8 geïntroduceerd, dat snel populair werd, omdat het efficiënt was en compatible was met ASCII.

Wat is ASCII (American Standard Code for Information Interchange)?

ASCII beschrijft 128 tekens die elk worden weergegeven door 7 bits, variërend van 0 tot 127. Deze tekens omvatten 33 niet-afdrukbare controletekens zoals tab en regelovergang, en 95 afdrukbare tekens zoals het Latijnse alfabet in hoofd- en kleine letters, Arabische cijfers en verschillende leestekens. Elk teken heeft een unieke 7-bits code, bijvoorbeeld ‘A’ heeft code 65. Oorspronkelijk ontworpen voor Engelse tekst, biedt ASCII voldoende tekens voor basisletters, cijfers en controlekarakters.

Lees meer over ASCII op Wikipedia (en)

Wat is Unicode?

Unicode is een standaard om alle tekens van menselijke talen weer te geven. Het lost het probleem op dat ASCII beperkt is tot 128 tekens door gebruik te maken van maximaal 32 bits per teken, wat meer dan vier miljard verschillende tekens mogelijk maakt, hoewel momenteel slechts ongeveer een miljoen tekens worden gebruikt. Elk karakter krijgt een unieke codepunt tussen U+0000 en U+10FFFF, waardoor Unicode letters, cijfers, symbolen, emoji’s en speciale karakters kan weergeven. De eerste versie verscheen in 1991 en werd sindsdien uitgebreid om bijna alle geschreven talen wereldwijd te ondersteunen.

Lees meer over Unicode op Wikipedia (en)

Wat is UTF-8 (Unicode Transformation Format – 8-bit)

UTF-8 is een handige manier om tekens te coderen. Het gebruikt verschillende lengtes voor verschillende tekens, van één tot vier bytes. Dit betekent dat alle Unicode-tekens ermee kunnen worden weergegeven. Het is een belangrijke standaard op het internet omdat het ook compatibel is met oudere ASCII-systemen voor de eerste 128 tekens. Dit maakt het ideaal voor moderne software en websites, omdat het efficiënt tekst kan opslaan en verzenden, inclusief emoji’s en speciale tekens. Zo wordt bijvoorbeeld de letter ‘A’ in UTF-8 gecodeerd als 01000001 (65 in decimaal), net zoals in ASCII, wat zorgt voor naadloze integratie tussen oudere en nieuwere tekensets.

Lees meer over UTF-8 op Wikipedia (en)

De functie ASCII en Unicode (UTF-8)

Met de functie ASCII en Unicode (UTF-8) kun je tekst versleutelen naar ASCII of andersom. Daarnaast toont het verschillende berekeningen.

Bijna bovenin het scherm staat een schuifknop met keuze A-Z → ASCII en ASCII → A-Z.

A-Z → ASCII

Als je A-Z → ASCII kiest, typ je in het tekstveld bovenin het scherm de tekst die je wilt versleutelen naar ASCII.

Onder de schuifknop A-Z → ASCII / ASCII → A-Z staat een andere schuifknop Simpel/Gevorderd.

Simpel

Als je ‘simpel’ kiest zal de versleuteling volgens de standaard manier worden gedaan.

Gevorderd

Als je ‘gevorderd’ kiest verschijnt er een keuzemenu Coderen. Je hebt hier de mogelijkheid om te kiezen in welke formaat de Uitvoer getoond moet worden.

Je hebt de keuze uit:

  • Decimaal
  • Binair
  • Hexadecimaal

Daaronder staat een schuifknop met de keuzes Variabele en Vast waarmee je de blokgrootte kunt aangeven.

Variabele

Als je ‘variabele’ kiest zal GC Wizard de benodigde blokgrootte bepalen.

Vast

Als je ‘vast’ kiest verschijnt er een tekstveld waarmee je blokgrootte kunt aangeven volgens een vast formaat, zodat iedere versleutelde tekst hetzelfde aantal tekens krijgt in een blok. Je kunt de blokgrootte zelf invoeren of veranderen met de plus- en min-knop.

Onder Uitvoer verschijnt de versleutelde tekst.

Onder uitvoer volgen verschillende berekeningen van de Uitvoer. Lees hier meer over onder Berekeningen.’

Schermafdruk ascii coderen in GC Wizard

ASCII → A-Z

Als je ASCII→ A-Z kiest, typ je in het tekstveld bovenin het scherm de ASCII waarden die je wilt ontsleutelen.

Onder de schuifknop A-Z → ASCII / ASCII → A-Z staat een andere schuifknop Simpel/Gevorderd.

Simpel

Als je ‘simpel’ kiest zal de ontsleuteling volgens de standaard manier worden gedaan.

Gevorderd

Als je ‘gevorderd’ kiest verschijnt er een keuzemenu Coderen. Je kunt hier aangeven in welke formaat de Invoer is gegeven.

Je hebt de keuze uit:

  • Decimaal
  • Binair
  • Hexadecimaal

Daaronder staat een schuifknop met de keuzes Variabele en Vast waarmee je de blokgrootte kunt aangeven.

Variabele

Als je ‘variabele’ kiest zal GC Wizard de benodigde blokgrootte bepalen.

Vast

Als je ‘vast’ kiest verschijnt er een tekstveld waarmee je blokgrootte kunt aangeven volgens een vast formaat. Gebruik dit als ieder teken in de ingevoerde ASCII waarde dezelfde blokgrootte heeft. Je kunt zelf de waarde invoeren of de waarde veranderen met de plus- en min-knop.

Onder Uitvoer verschijnt de ontsleutelde tekst.

Onder uitvoer volgen verschillende berekeningen van de Uitvoer. Lees hier meer over onder Berekeningen.’

Schermafdruk ascii decoderen in GC Wizard

Berekeningen

In de functie ASCII en Unicode (UTF-8) staan onder het Uitvoer gedeelte berekeningen.

Deze berekeningen worden automatisch gemaakt voor de bekende cijferreeks. (De cijferreeks onder Uitvoer, als je letters wilt versleutelen naar ASCII-waarden en de cijferreeks in het tekstveld als je waarden wilt ontsleutelen naar letters).

Gebruikelijke berekeningen:

In het gedeelte Gebruikelijke berekeningen staan berekeningen die je regelmatig binnen geocaching tegenkomt. Dit zijn de volgende berekeningen:

  • Som (Woordwaarde/Cijfersom)
  • Kruissom (KS/CS)
  • KS gereduceerd (tot 1 cijfer)

Aanvullende Berekeningen

Daarnaast berekent toont GC Wizard ook de volgende aanvullende berekeningen:

  • Tel tekens
  • Tellen verschillende tekens
  • Tel individuele letters
  • Tel individuele cijfers
  • Som afwisselend +/- (achterwaarts)
  • Som afwisselend +/- (voorwaarts)
  • KS afwiss. (voorw.) van Som
  • KS van alle cijfers
  • Digitale wortel van alle cijfers
  • KS cijfers afwisselend (achteruit)
  • KS cijfers afwisselend (vooruit)
  • KS afwisselend +/- (achterw.) van een som
  • KS afwisselend +/- (voorw.) van een som
  • KS van alle cijfers
  • Gereduceerde cijfersom van alle cijfers
  • KS cijfers afwisselend +/- (achterwaarts)
  • KS cijfers afwisselend +/- (voorwaarts)
  • Product
  • Product afwisselend +/-
  • KS van Product
  • Gereduceerde cijfersom van Product
  • KS afw.+/- (achterw.) van Product
  • KS afw.+/- (voorw.) van Product
  • Kruisproduct
  • Gereduceerde Kruisproduct (1 cijfer)
  • Kruisproduct afwisselend +/-