<?php
include_once $_SERVER['DOCUMENT_ROOT'] . '/include/shared-manual.inc';
$TOC = array();
$TOC_DEPRECATED = array();
$PARENTS = array();
include_once dirname(__FILE__) ."/toc/book.xml.inc";
$setup = array (
  'home' => 
  array (
    0 => 'index.php',
    1 => 'PHP Manual',
  ),
  'head' => 
  array (
    0 => 'UTF-8',
    1 => 'fr',
  ),
  'this' => 
  array (
    0 => 'xml.encoding.php',
    1 => 'Codage des caract&egrave;res',
    2 => 'Codage des caract&egrave;res',
  ),
  'up' => 
  array (
    0 => 'book.xml.php',
    1 => 'Analyseur syntaxique XML',
  ),
  'prev' => 
  array (
    0 => 'xml.error-codes.php',
    1 => 'Codes d\'erreurs',
  ),
  'next' => 
  array (
    0 => 'xml.examples.php',
    1 => 'Exemples',
  ),
  'alternatives' => 
  array (
  ),
  'source' => 
  array (
    'lang' => 'fr',
    'path' => 'reference/xml/encoding.xml',
  ),
  'history' => 
  array (
  ),
);
$setup["toc"] = $TOC;
$setup["toc_deprecated"] = $TOC_DEPRECATED;
$setup["parents"] = $PARENTS;
manual_setup($setup);

contributors($setup);

?>
<div id="xml.encoding" class="article">
 <h1 class="title">Codage des caractères</h1>

 <p class="para">
  L&#039;extension XML de PHP supporte les caractères
  <a href="http://www.unicode.org/" class="link external">&raquo;&nbsp;Unicode</a> grâce à
  différents codages. Il y a deux types de codages de
  caractères : le <span class="glossterm">codage à la source</span> et le
  <span class="glossterm">codage à la cible</span>. PHP utilise le
  <code class="literal">UTF-8</code> comme représentation interne.
 </p>
 <p class="para">
  L&#039;encodage à la source est effectué lors de
  <a href="function.xml-parse.php" class="link">l&#039;analyse</a> du fichier par XML.
  Lors de la <a href="function.xml-parser-create.php" class="link">création
  d&#039;un analyseur XML</a>), un type de codage à la
  source peut être spécifié (et il ne pourra plus
  être modifié jusqu&#039;à la destruction de
  l&#039;analyseur). Les codages supportés sont :
  <code class="literal">ISO-8859-1</code>, <code class="literal">US-ASCII</code> et
  <code class="literal">UTF-8</code>. Les deux derniers sont des codages
  à un seul octet, c&#039;est-à-dire que les caractères
  sont représentés sur un seul octet. <code class="literal">UTF-8</code>
  peut représenter des caractères composés par un
  nombre variable de bits (jusqu&#039;à 21), allant de 1 à
  quatre octets. Le codage à la source par défaut utilisé par PHP est
  <code class="literal">ISO-8859-1</code>.
 </p>
 <p class="para">
  Le codage à la cible est effectué lorsque PHP transfère
  les données aux gestionnaires XML. Lorsqu&#039;un analyseur est
  créé, le codage à la cible est spécifié
  de la même façon que le codage à la source, mais
  il peut être modifié à tout moment. Le codage
  à la cible affectera les données de caractères, tout comme les
  noms des balises et les cibles des instructions de traitement.
 </p>
 <p class="para">
  Si l&#039;analyseur XML rencontre des caractères en dehors de la plage que
  son encodage à la source est capable de représenter, il retournera une erreur.
 </p>
 <p class="para">
  Si PHP rencontre des caractères dans le document XML analysé
  qu&#039;il ne peut pas représenter dans le codage à la cible
  choisi, les caractères problématiques seront « déclassés ».
  Actuellement, cela signifie que ces caractères sont remplacés par un point
  d&#039;interrogation.
 </p>
</div>
<?php manual_footer($setup); ?>