n
avril 1997, 95,43% des 4000 abonnés de LMB-Actu (devenu depuis Internet
Actu) recevaient les accents. La Francophonie aura eu raison d'Internet
! Pourtant il aura fallu du temps pour que les accents investissent
Internet.
Pourquoi les accents sont les
mal-aimés du courrier électronique ?
Ne nous le cachons pas, l'e-mail est à l'origine américain.
Et outre-atlantique, les caractères accentués ne courent
pas les rues. Ce qui explique que les concepteurs du mail aient "oublié"
de prendre en compte les accents.
Pourquoi Internet ne peut-il
pas prendre en compte les accents ?
On va passer par une petite explication technique.
Sur Internet, on ne transmet pas directement les caractères.
On associe à chacun un code en binaire - exactement comme un
code barre formé de traits fins et de traits épais -
et c'est ce code qui circule sur Internet.
Le nom du code originel (celui qui n'aime pas les accents), c'est
le code ASCII (ou US-ASCII). Grâce à lui, chaque caractère
(a, b, c, ..., A, B, C, 0,1,2, ...,$, #, etc.) est associé
à un code sur 7 bits, c'est à dire un code formé
de 7 barres.
Ce codage sur 7 bits ne peut répertorier que
128 caractères.
Faisons les comptes : 10 chiffres (de 0 à 9), 26 lettres minuscules,
26 lettres majuscules, une dizaine de signes de ponctuation, des caractères
exotiques (&, #, \, $, %) et des caractères spéciaux
(retour-chariot, etc)... il ne reste plus assez de cases libres dans
les 128 pour introduire nos accents.
Alors comment va-t-on caser
nos accents ?
Une seule solution : ajouter une barre (1 bit) pour pouvoir répertorier
davantage de caractères. Passer de 7 bits à 8 bits permet
en effet d'accepter le double de caractères (de 128 à
256).
Alors ça y est c'est
bon ?
Non hélas ! Le courrier électronique est à l'origine
basé sur le protocole SMTP, qui ne gère que le code
à 7 bits. Et le protocole à 8 bits qui lui succède,
l'ESMTP, n'est pas encore installé sur tous les serveurs (on
ne peut pas changer tout le système du jour au lendemain) !
Donc, pour pouvoir faire passer des codes à 8 bits dans un
système de codes à 7 bits, il faut ruser !
C'est quoi la ruse ?
Coder. C'est à dire trafiquer un peu le message pour qu'il
puisse passer sans problème à travers les mailles du
filet. Deux principaux systèmes de codage cohabitent, au sein
d'un ensemble appelé MIME :
- Le Quoted-Printable
Les caractères accentués sont remplacés par des signes = suivis
du code hexadécimal du caractère (par exemple =E9 pour "é"...).
L'ensemble du message ne contient donc plus que des caractères
7 bits et passe sans encombres à travers les différentes
passerelles du Net. A l'arrivée, le logiciel de messagerie
fait l'opération inverse.
- Le Base64
Les caractères 8 bits sont codés sur 6 bits : un groupe de
3 octets (soit 24 bits) devient ainsi 4 ensembles de 6 bits, les
6 bits représentant un sous-ensemble de l'US-ASCII :
A-Z, a-z, +, /, et =. Là aussi, l'ensemble
du message passe sans encombres à travers les différentes passerelles
du Net.
Si vous ne codez pas votre message, celui-ci est envoyé au
format 8 bits
Les caractères accentués ne sont alors pas convertis et sont envoyés
tels quels. Cette méthode comporte des risques. En cas de rencontre
avec une (vieille) passerelle 7 bits, vous pouvez avoir plusieurs
cas de figure :
- le message est converti en Quoted-Printable (cas le plus fréquent).
- le message est converti en base 64.
- les accents du message sont transformés par des caractères faisant
partie du jeu de caractère 7 bits.
- Les accents du message sont remplacés par des caractères
exotiques (Ä, Æ, š, etc.) Ceci se produit quand le jeu de caractères
par défaut n'est pas le même sur les deux machines (iso-8859-1,
8859-2...).
Je
fais comment en pratique ?
Il faut plusieurs conditions pour que les accents "passent".
1. que votre logiciel de courrier
et celui de votre correspondant supportent le MIME (Quoted printable
et Base 64) et soient correctement configurés
2. que tous les routeurs (ordinateurs
qui font circuler l'information) entre votre machine et la sienne
n'y soient pas trop allergiques.
|
|