Dans le codage UTF-8, chaque caractère Unicode se voit attribuer une chaîne de longueur variable spécialement codée. Ici, UTF-8 prend en charge des chaînes de caractères d’une longueur maximale de quatre octets, auxquelles tous les caractères Unicode peuvent être associés.
UTF-8 a une importance centrale en tant que codage de caractères global sur Internet.
UTF-8 est congruent avec l’ASCII dans les 128 premiers caractères (indices 0-127).