<?php
include_once $_SERVER['DOCUMENT_ROOT'] . '/include/shared-manual.inc';
$TOC = array();
$TOC_DEPRECATED = array();
$PARENTS = array();
include_once dirname(__FILE__) ."/toc/book.mbstring.inc";
$setup = array (
  'home' => 
  array (
    0 => 'index.php',
    1 => 'PHP Manual',
  ),
  'head' => 
  array (
    0 => 'UTF-8',
    1 => 'fr',
  ),
  'this' => 
  array (
    0 => 'mbstring.encodings.php',
    1 => 'Jeux de caract&egrave;res support&eacute;s',
    2 => 'Jeux de caract&egrave;res support&eacute;s',
  ),
  'up' => 
  array (
    0 => 'book.mbstring.php',
    1 => 'Cha&icirc;nes de caract&egrave;res multioctets',
  ),
  'prev' => 
  array (
    0 => 'mbstring.constants.php',
    1 => 'Constantes pr&eacute;-d&eacute;finies',
  ),
  'next' => 
  array (
    0 => 'mbstring.ja-basic.php',
    1 => 'Cas des caract&egrave;res japonais',
  ),
  'alternatives' => 
  array (
  ),
  'source' => 
  array (
    'lang' => 'fr',
    'path' => 'reference/mbstring/encodings.xml',
  ),
  'history' => 
  array (
  ),
);
$setup["toc"] = $TOC;
$setup["toc_deprecated"] = $TOC_DEPRECATED;
$setup["parents"] = $PARENTS;
manual_setup($setup);

contributors($setup);

?>
<div id="mbstring.encodings" class="chapter">
  <h1 class="title">Jeux de caractères supportés</h1>

  <table class="segmentedlist">
   <caption><strong>Jeux de caractères supportés</strong></caption>
   <thead><tr><th>Nom dans le registre IANA</th>
   <th>Jeux de caractères</th>
   <th>Description</th>
   <th>Notes</th>
   </tr></thead><tbody><tr class="seglistitem">
    <td class="seg">ISO-10646-UCS-4</td>
    <td class="seg">ISO 10646</td>
    <td class="seg">
     Le jeu de caractères universel (<code class="literal">Universal Character Set</code>),
     avec 31 bits par caractère, au standard <code class="literal">UCS-4</code>
     par <code class="literal">ISO/IEC 10646</code>. Il est synchronisé avec 
     la dernière version d&#039;Unicode.
    </td>
    <td class="seg">
     Si ce nom est utilisé dans l&#039;outil de conversion, le convertisseur
     essaie de reconnaître le texte à partir du dernier BOM
     (<code class="literal">byte order mark</code>), pour connaître l&#039;ordre 
     des bits.
    </td>
   </tr>
   <tr class="seglistitem">
    <td class="seg">ISO-10646-UCS-4</td>
    <td class="seg">UCS-4</td>
    <td class="seg">
     Voir ci-dessus.
    </td>
    <td class="seg">
     Contrairement à <code class="literal">UCS-4</code>, les chaînes sont supposées
     être au format big endian.
    </td>
   </tr>
   <tr class="seglistitem">
    <td class="seg">ISO-10646-UCS-4</td>
    <td class="seg">UCS-4</td>
    <td class="seg">
     Voir ci-dessus.
    </td>
    <td class="seg">
     Contrairement à <code class="literal">UCS-2</code>, les chaînes sont supposées
     être au format little endian.
    </td>
   </tr>
   <tr class="seglistitem">
    <td class="seg">ISO-10646-UCS-2</td>
    <td class="seg">UCS-2</td>
    <td class="seg">
     Le jeu de caractères universel (<code class="literal">Universal Character Set</code>),
     avec 16 bits par caractère, au standard <code class="literal">UCS-2</code>
     par <code class="literal">ISO/IEC 10646</code>. Il est synchronisé avec 
     la dernière version d&#039;Unicode.
    </td>
    <td class="seg">
     Si ce nom est utilisé dans l&#039;outil de conversion, le convertisseur
     essaie de reconnaître le texte à partir du dernier BOM
     (<code class="literal">byte order mark</code>), pour connaître l&#039;ordre 
     des bits.
    </td>
   </tr>
   <tr class="seglistitem">
    <td class="seg">ISO-10646-UCS-2</td>
    <td class="seg">UCS-2</td>
    <td class="seg">
     Voir ci-dessus.
    </td>
    <td class="seg">
     Contrairement à <code class="literal">UCS-4</code>, les chaînes sont supposées
     être au format big endian.
    </td>
   </tr>
   <tr class="seglistitem">
    <td class="seg">UTF-32</td>
    <td class="seg">Unicode</td>
    <td class="seg">
     Format de transformation d&#039;Unicode, de 32 bits, dont les cartes
     correspondent au jeu standard Unicode. Ce jeu n&#039;est pas identique
     à <code class="literal">UCS-4</code> car les caractères Unicode étaient limités
     à des valeurs de 21 bits.
    </td>
    <td class="seg">
     Si ce nom est utilisé dans l&#039;outil de conversion, le convertisseur
     essaie de reconnaître le texte à partir du dernier BOM
     (<code class="literal">byte order mark</code>), pour connaître l&#039;ordre 
     des bits.
    </td>
   </tr>
   <tr class="seglistitem">
    <td class="seg">UTF-32BE</td>
    <td class="seg">Unicode</td>
    <td class="seg">
     Voir ci-dessus.
    </td>
    <td class="seg">
     Contrairement à <code class="literal">UTF-32</code>, les chaînes sont supposées
     être au format big endian.
    </td>
   </tr>
   <tr class="seglistitem">
    <td class="seg">UTF-32LE</td>
    <td class="seg">Unicode</td>
    <td class="seg">
     Voir ci-dessus.
    </td>
    <td class="seg">
     Contrairement à <code class="literal">UTF-32</code>, les chaînes sont supposées
     être au format little endian.
    </td>
   </tr>
   <tr class="seglistitem">
    <td class="seg">UTF-16</td>
    <td class="seg">Unicode</td>
    <td class="seg">
     Format de transformation d&#039;Unicode sur 16 bits. Il faut noter
     que <code class="literal">UTF-16</code> n&#039;est plus identique à <code class="literal">UCS-2</code>
     car un mécanisme a été introduit en Unicode 2.0 et
     <code class="literal">UTF-16</code> fait maintenant référence à un
     codage de 21 bits.
    </td>
    <td class="seg">
     Si ce nom est utilisé dans l&#039;outil de conversion, le convertisseur
     essaie de reconnaître le texte à partir du dernier BOM
     (<code class="literal">byte order mark</code>), pour connaître l&#039;ordre 
     des bits.
    </td>
   </tr>
   <tr class="seglistitem">
    <td class="seg">UTF-16BE</td>
    <td class="seg">Unicode</td>
    <td class="seg">
     Voir ci-dessus.
    </td>
    <td class="seg">
     Contrairement à <code class="literal">UTF-16</code>, les chaînes sont supposées
     être au format big endian.
    </td>
   </tr>
   <tr class="seglistitem">
    <td class="seg">UTF-16LE</td>
    <td class="seg">Unicode</td>
    <td class="seg">
     Voir ci-dessus.
    </td>
    <td class="seg">
     Contrairement à <code class="literal">UTF-16</code>, les chaînes sont supposées
     être au format little endian.
    </td>
   </tr>
   <tr class="seglistitem">
    <td class="seg">UTF-8</td>
    <td class="seg">Unicode / UCS</td>
    <td class="seg">
     Format de transformation Unicode de 8 bits.
    </td>
    <td class="seg">none</td>
   </tr>
   <tr class="seglistitem">
    <td class="seg">UTF-7</td>
    <td class="seg">Unicode</td>
    <td class="seg">
     Un format compatible avec le courrier électronique d&#039;Unicode,
     spécifié dans <a href="https://datatracker.ietf.org/doc/html/rfc2152" class="link external">&raquo;&nbsp;RFC2152</a>.
    </td>
    <td class="seg">none</td>
   </tr>
   <tr class="seglistitem">
    <td class="seg">aucun</td>
    <td class="seg">Unicode</td>
    <td class="seg">
     Une variante d&#039;<code class="literal">UTF-7</code> qui est spécialement utilisée dans le 
     <a href="https://datatracker.ietf.org/doc/html/rfc3501" class="link external">&raquo;&nbsp;protocole IMAP</a>.
    </td>
    <td class="seg">none</td>
   </tr>
   <tr class="seglistitem">
    <td class="seg">
     US-ASCII (recommandé) / iso-ir-6 / ANSI_X3.4-1986 /
     ISO_646.irv:1991 / ASCII / ISO646-US / us / IBM367 / CP367 / csASCII
    </td>
    <td class="seg">ASCII / ISO 646</td>
    <td class="seg">
     ASCII, <code class="literal">American Standard Code for Information Interchange</code>
     est un format classique de 7 bits. Il est aussi normalisé internationalement,
     sous le nom <code class="literal">ISO 646</code>.
    </td>
    <td class="seg">(none)</td>
   </tr>
   <tr class="seglistitem">
    <td class="seg">
     EUC-JP (recommandé) /
     Extended_UNIX_Code_Packed_Format_for_Japanese / csEUCPkdFmtJapanese
    </td>
    <td class="seg">
     Composé d&#039;US-ASCII / JIS X0201:1997 (hankaku kana) /
     JIS X0208:1990 / JIS X0212:1990
    </td>
    <td class="seg">
     Comme on peut le voir, le nom est dérivé de l&#039;abréviation de 
     <code class="literal">Extended UNIX Code Packed Format for Japanese</code>, 
     ce jeu est essentiellement utilisé sur les plates-formes Unix.
     Le jeu original, <code class="literal">Extended UNIX Code</code>, 
     est conçu sur la base de <code class="literal">ISO 2022</code>.
    </td>
    <td class="seg">
     Le jeu identifié par <code class="literal">EUC-JP</code> est différent 
     de <code class="literal">IBM932 / CP932</code>, qui est utilisé par
     <code class="literal">OS/2®</code> et Microsoft® Windows®.
     Pour échanger des informations avec ces plates-formes, 
     utiliser <code class="literal">EUCJP-WIN</code>.
    </td>
   </tr>
   <tr class="seglistitem">
    <td class="seg">Shift_JIS (recommandé) / MS_Kanji / csShift_JIS</td>
    <td class="seg">Composé de JIS X0201:1997 / JIS X0208:1997</td>
    <td class="seg">
     <code class="literal">Shift_JIS</code> a été développé au début des années 80,
     et, au même moment, les premiers traitements de textes étaient 
     mis sur le marché. Il a été fait pour conserver la compatibilité avec
     le jeu <code class="literal">JIS X 0201:1976</code>. Selon la définition de
     l&#039;IANA, le jeu de caractères <code class="literal">Shift_JIS</code> est légèrement
     différent de <code class="literal">IBM932 / CP932</code>. Cependant, les noms
     <code class="literal">&quot;SJIS&quot;</code> et <code class="literal">&quot;Shift_JIS&quot;</code> sont
     souvent utilisés à tort, pour ces jeux.
    </td>
    <td class="seg">Pour <code class="literal">CP932</code>, utiliser <code class="literal">SJIS-WIN</code>.</td>
   </tr>
   <tr class="seglistitem">
    <td class="seg">(none)</td>
    <td class="seg">
     Composé de JIS X0201:1997 / JIS X0208:1997 / IBM extensions / NEC extensions
    </td>
    <td class="seg">
     Même si ce &quot;jeu de caractères&quot; utilise le même jeu que 
     <code class="literal">EUC-JP</code>, il est en fait différent. Il a juste
     quelques caractères de différence.
    </td>
    <td class="seg">none</td>
   </tr>
   <tr class="seglistitem">
    <td class="seg">Windows-31J / csWindows31J</td>
    <td class="seg">
     Composé de JIS X0201:1997 / JIS X0208:1997 / IBM extensions / NEC extensions
    </td>
    <td class="seg">
     Même si ce &quot;jeu de caractères&quot; utilise le même jeu que 
     <code class="literal">Shift_JIS</code>, il est en fait différent. Il a juste
     quelques caractères de différence.
    </td>
    <td class="seg">(none)</td>
   </tr>
   <tr class="seglistitem">
    <td class="seg">ISO-2022-JP (recommandé) / csISO2022JP</td>
    <td class="seg">
     US-ASCII / JIS X0201:1976 / JIS X0208:1978 / JIS X0208:1983
    </td>
    <td class="seg"><a href="https://datatracker.ietf.org/doc/html/rfc1468" class="link external">&raquo;&nbsp;RFC1468</a></td>
    <td class="seg">aucun</td>
   </tr>
   <tr class="seglistitem">
    <td class="seg">JIS</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">ISO-8859-1</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">ISO-8859-2</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">ISO-8859-3</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">ISO-8859-4</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">ISO-8859-5</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">ISO-8859-6</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">ISO-8859-7</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">ISO-8859-8</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">ISO-8859-9</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">ISO-8859-10</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">ISO-8859-13</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">ISO-8859-14</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">ISO-8859-15</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">ISO-8859-16</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">byte2be</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">byte2le</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">byte4be</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">byte4le</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">BASE64</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">HTML-ENTITIES</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">7bit</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">8bit</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">EUC-CN</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">CP936</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">HZ</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">EUC-TW</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">CP950</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">BIG-5</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">EUC-KR</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">UHC (CP949)</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">ISO-2022-KR</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">Windows-1251 (CP1251)</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">Windows-1252 (CP1252)</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">CP866 (IBM866)</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">KOI8-R</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">KOI8-U</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
  </tbody></table>
 </div>
<?php manual_footer($setup); ?>