Cours et notions de base des codes et algorithmes associés

Extrait du cours codes et algorithmes associés

Codification des caractères
Le domaine qui nous intéresse est celui du traitement automatique de l’information. La seule technologie actuellement peu coûteuse nous impose une codification finale binaire, pour les raisons que l’on connaît bien. Les premiers problèmes rencontrés par les constructeurs d’ordinateurs ont été ceux du codage des nombres et des caractères. Intéressons nous d’abord au codage des caractères.
De nombreux codes ont vu le jour. Leur existence reste souvent liée à un constructeur ou à la définition d’un standard par un organisme international. Sans vouloir refaire l’histoire du codage des caractères,voici quelques éléments qui vous permettront sans doute de remettre un peu d’ordre dans les connaissances que vous avez à leur propos.
Quelques notions de base
Il va de soi que la plus petite unité d’information est codée au moyen d’un chiffre binaire (en anglais binary digit ou bit). Avec deux symboles il n’est possible de coder que deux informations différentes sur une position binaire. C’est pourquoi les ordinateurs ont davantage été conçus pour traiter des mots plutôt que des bits. Le mot est l’élément d’information de base qui représente la plus petite unité adressable. C’est souvent l’octet, mais parfois un nombre quelconque de bits, 12, 16, 48…). La taille de cette unité adressable dépend du constructeur.
Le code ASCII
L’un des codes les plus connus des utilisateurs de PC est le code ASCII (American Standard Code for Information Interchange). Il a été défini en 1963 aux Etats-Unis puis adopté par d’autres organismes, notamment l’ISO (International Standards Organization) qui en a fait le code ISO-7. Ce code est aussi connu sous le nom d’alphabet international n°5 ou de CCITT n°5 puisque recommandé par l’avis n°5 du Comité Consultatif International Télégraphique et Téléphonique. C’est un code à 7 bits autorisant donc le codage de 128 caractères parmi lesquels, tous les caractères alphanumériques utilisés en anglais.
Comme la plupart des ordinateurs traitent les bits par paquets de huit ou plus, le huitième bit est, soit inutilisé, soit utilisé comme bit de parité pour le contrôle lors de la transmission (voir plus loin), soit utilisé pour coder un maximum de 128 caractères supplémentaires tels des caractères graphiques et des caractères nationaux (caractères accentués). On parle alors de code ASCII étendu.
Tableau des codes ASCII
Le tableau de la page suivante reprend les caractères du code ASCII non étendu. Les codes 0 à 31sont traditionnellement réservés à des caractères de contrôle dont l’existence est historique. Les plus connus d’entre eux sont certainement le 7 (BELL), le 8 (BACKSPACE) et le 13 (CARRIAGE RETURN).
Le caractère $ est codé 24 en hexadécimal et donc 00100100 en binaire. Son code décimal est 36.
Le caractère A est codé 41 en hexadécimal et donc 01000001 en binaire. Son code décimal est 65.
Le caractère Z est codé 5A en hexadécimal et donc 01011010 en binaire. Son code décimal est 90.
Le caractère a est codé 61 en hexadécimal et donc 01100001 en binaire. Son code décimal est 97.
Quelques observations intéressantes
Avec un tel code, les transformations des majuscules en minuscules et inversement sont formellement triviales. Un exécutant formel doit simplement modifier le troisième bit (bit n°5). En français, l’emploi de caractères accentués complique un peu le problème. Une marche à suivre est cependant possible.

LIRE AUSSI :  Algorithme génétique

…….

Si le lien ne fonctionne pas correctement, veuillez nous contacter (mentionner le lien dans votre message)
Cours et notions de base des codes et algorithmes associés (477 KO) (Cours PDF)
codes et algorithmes associés

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *