Quand une page est stockée dans le serveur en format Unicode UTF-8, mais affichée dans le navigateur par erreur en mode de caractère uni-octet, abusivement appelé ASCII, ie, en charset=windows-1252, ce caractère Unicode UTF-8 prend deux places.
Essayez le caractère é Unicode: il est doublé en é
Il était une fois dans l'Ouest de la Chine... il faisait froid en hiver.
Au contraire si votre page est stockée dans le serveur web en format ANSI/ASCII, mais affichée dans le navigateur du client par erreur en mode de caractère multi-octet UTF-8, appelé Unicode, en mode Unicode UTF-8, ie, en charset=UTF-8, ce caractère ASCII devient plus mince encore pour devenir un diamant point d'interrogation ou carrУЉ vide, comme s'il n'est pas assez costaud pour occuper même une seule place dans le monde Unicode qui est multi-octet.
En rУЈgle gУЉnУЉrale, quand votre fichier est en codage plus petit, plus maigre que le codage du navigateur У l'affichage, le diamant point d'interrogation ou carrУЉ vide � apparaУЎt.
Essayez le caractère é ASCII: il est réduit en diamant point d'interrogation ou carrУЉ vide �.
Il �tait une fois dans l'Ouest de la Chine... il faisait froid en hiver.
Il est utile de prУЉciser que tous les caractУЈres ASCII du code 0 У 127 gardent toujours les mУЊmes codes sans changement quelque soit le codage des caractУЈres, ASCII, GBK, Unicode...
Tous les caractУЈres ASCII УЉtendus du code 0 У 255 (2**8=256, uni-octet, mono-byte) peuvent УЊtre stockУЉs soit dans un fichier ASCII, soit en format Unicode UTF-8. Le contraire n'est pas vrai, les caractУЈres multi-octet (multi-byte) avec un code supУЉrieur ou УЉgal У 256, qui ne peuvent УЊtre conservУЉs que dans un fichier Unicode comme UTF-8, ou bien dans un format spУЉcifique (code page pays) tel le GBK pour les idУЉogrammes chinois.
Sur le web, un caractУЈre Unicode peut en outre s'exprimer en code entitУЉ HTML, ainsi stockУЉ dans un fichier du codage ASCII. Par exemple, l'idУЉogramme шЏ signifiant Langue, peut УЊtre stockУЉ en mode ASCII par la chaУЎne 语, composУЉe uniquement des ampersand &, diУЈse #, suivi par des chiffres du numУЉro dУЉcimal de ce caractУЈre en Unicode, et terminУЉ par un point-virgule ;.
фИхНхКхЏЙфККчБЛфНхКшОхЄЇчшДЁчЎяМ
La Chine doit faire une contribution relativement grande У l'HumanitУЉ !
ййиЊиЙйй иЙйй иЇйиЕйй иЊйиЏйй иЇиГйиЇй иЇиЊ иЇйиЈиБ ййиЈиДиБйиЉ!
ааИбаАаЙ аДаОаЛаЖаЕаН баДаЕаЛаАбб аБаОаЛббаИаЙ аВаКаЛаАаД аВ баЕаЛаОаВаЕбаЕббаВаО!
ЮЮЏЮНЮБ ЮИЮБ ЯЯЮЯЮЕЮЙ ЮНЮБ ЯЯ ЮМЮВЮЌЮЛЮЕЮЙ ЯЮЕЯЮЙЯЯЯЯЮЕЯЮП ЯЯЮЗЮН ЮБЮНЮИЯЯЯЯЯЮЗЯЮБ!
фИхНуЏфККщЁуЋхЄЇууЊшВЂчЎуууІуу ууяМ
ззЁзз ззЉ зЊзЈззз ззззз ззз ззЉззЊ!
рЄрЅрЄЈ рЄЎрЄОрЄЈрЄЕ рЄрЄОрЄЄрЄП рЄрЅ рЄВрЄПрЄ рЄрЄ рЄЌрЄЁрЄМрЄО рЄЏрЅрЄрЄІрЄОрЄЈ рЄрЄАрЄЈрЄО рЄрЄОрЄЙрЄПрЄ!
рИрИЕрИрИрИЇрИЃрИрИАрЙрИЋрЙрИЁрИЕрИЊрЙрИЇрИрИЃрЙрИЇрИЁрИЁрИВрИрИрИЖрЙрИрЙрИрИЗрЙрИрИЁрИрИИрИЉрИЂрИрИВрИрИД!
клй иЈиЇлиЏ иГйй иЈлиДиЊиБл иЈй иЇйиГиЇй иБиЇ!
China shall make a relatively great contribution to the Man Kind!
Cette page est stockУЉe dans le disque dur en format UTF-8 sans BOM. Mais je vous propose de l'afficher en diffУЉrents codages. Elle peut devenir illisible si le codage diffУЈre trop. Il faut revenir en UTF-8 si vous avez mal У la tУЊte. Testez vous-mУЊme sur votre navigateur en cliquant sur les liens suivants:
[Auto Detection] (auto) | Arabic (ISO-8859-6) | Arabic (Windows-1256) | ASCII Western European (ISO-8859-1) | ASCII Western European (Windows-1252) | Baltic (ISO-8859-4) | Baltic (Windows-1257) | Central European (Windows-1250) | Chinese Simplified (GB18030) | Chinese Simplified (GB2312) | Chinese Simplified (GBK) | Chinese Simplified (HZ) | Chinese Traditional (Big5) | Cyrillic (ISO-8859-5) | Cyrillic (KOI8-R) | Cyrillic (KOI8-U) | Cyrillic (Windows-1251) | Greek (Windows-1253) | Hebrew (Windows-1255) | Hebrew (ISO-8859-8-l) | Celtic (ISO-8859-14) | Central European (ISO-8859-2) | Estonian (ISO-8859-13) | Greek (ISO-8859-7) | Hebrew (ISO-8859-8) | Japanese (EUC-JP) | Japanese (ISO-2022-JP) | Japanese (Shift_JIS) | Korean (EUC-KR) | Latin 9 (ISO-8859-15) | Nordic (ISO-8859-10) | Roumain (ISO-8859-16) | South European (ISO-8859-3) | Thai (TIS-620) | Turkish (ISO-8859-9) | Turkish (Windows-1254) | Unicode (UTF-16LE) | Unicode (UTF-8) | Vietnamese (Windows-1258).