<?php
include_once $_SERVER['DOCUMENT_ROOT'] . '/include/shared-manual.inc';
$TOC = array();
$TOC_DEPRECATED = array();
$PARENTS = array();
include_once dirname(__FILE__) ."/toc/book.mbstring.inc";
$setup = array (
  'home' => 
  array (
    0 => 'index.php',
    1 => 'PHP Manual',
  ),
  'head' => 
  array (
    0 => 'UTF-8',
    1 => 'ja',
  ),
  'this' => 
  array (
    0 => 'mbstring.encodings.php',
    1 => 'サポートされるエンコーディングの概要',
    2 => 'サポートされるエンコーディングの概要',
  ),
  'up' => 
  array (
    0 => 'book.mbstring.php',
    1 => 'マルチバイト文字列',
  ),
  'prev' => 
  array (
    0 => 'mbstring.constants.php',
    1 => '定義済み定数',
  ),
  'next' => 
  array (
    0 => 'mbstring.ja-basic.php',
    1 => '日本語のマルチバイト文字に関する基本事項',
  ),
  'alternatives' => 
  array (
  ),
  'source' => 
  array (
    'lang' => 'ja',
    'path' => 'reference/mbstring/encodings.xml',
  ),
  'history' => 
  array (
  ),
);
$setup["toc"] = $TOC;
$setup["toc_deprecated"] = $TOC_DEPRECATED;
$setup["parents"] = $PARENTS;
manual_setup($setup);

contributors($setup);

?>
<div id="mbstring.encodings" class="chapter">
 <h1 class="title">サポートされるエンコーディングの概要</h1>

 <table class="segmentedlist">
  <caption><strong>サポートされるエンコーディングの概要</strong></caption>
  <thead><tr><th>IANA 文字セット登録名</th>
  <th>依存する文字集合</th>
  <th>説明</th>
  <th>注記</th>
  </tr></thead><tbody><tr class="seglistitem">
   <td class="seg">ISO-10646-UCS-4</td>
   <td class="seg">ISO 10646</td>
   <td class="seg">
    31 ビットコード空間を使用するユニバーサル文字セットで、
    ISO/IEC 10646 によって UCS-4 として標準化されています。
    最新版の Unicode コードマップと連動しています。
   </td>
   <td class="seg">
    この名前をエンコーディング変換の際に使用すると、
    先頭の BOM (バイトオーダーマーク)
    にもとづいてそれ以降のバイト列のエンディアンを識別します。
   </td>
  </tr>
  <tr class="seglistitem">
   <td class="seg">ISO-10646-UCS-4</td>
   <td class="seg">UCS-4</td>
   <td class="seg">
    上を参照ください。
   </td>
   <td class="seg">
    <code class="literal">UCS-4</code> とは対照的に、
    文字列が常にビッグエンディアン形式とみなされます。
   </td>
  </tr>
  <tr class="seglistitem">
   <td class="seg">ISO-10646-UCS-4</td>
   <td class="seg">UCS-4</td>
   <td class="seg">
    上を参照ください。
   </td>
   <td class="seg">
    <code class="literal">UCS-4</code> とは対照的に、
    文字列が常にリトルエンディアン形式とみなされます。
   </td>
  </tr>
  <tr class="seglistitem">
   <td class="seg">ISO-10646-UCS-2</td>
   <td class="seg">UCS-2</td>
   <td class="seg">
    16 ビットコード空間を使用するユニバーサル文字セットで、
    ISO/IEC 10646 によって UCS-2 として標準化されています。
    最新版の Unicode コードマップと連動しています。
   </td>
   <td class="seg">
    この名前をエンコーディング変換の際に使用すると、
    先頭の BOM (バイトオーダーマーク)
    にもとづいてそれ以降のバイト列のエンディアンを識別します。
   </td>
  </tr>
  <tr class="seglistitem">
   <td class="seg">ISO-10646-UCS-2</td>
   <td class="seg">UCS-2</td>
   <td class="seg">
    上を参照ください。
   </td>
   <td class="seg">
    <code class="literal">UCS-2</code> とは対照的に、
    文字列が常にビッグエンディアン形式とみなされます。
   </td>
  </tr>
  <tr class="seglistitem">
   <td class="seg">ISO-10646-UCS-2</td>
   <td class="seg">UCS-2</td>
   <td class="seg">
    上を参照ください。
   </td>
   <td class="seg">
    <code class="literal">UCS-2</code> とは対照的に、
    文字列が常にリトルエンディアン形式とみなされます。
   </td>
  </tr>
  <tr class="seglistitem">
   <td class="seg">UTF-32</td>
   <td class="seg">Unicode</td>
   <td class="seg">
    32 ビット幅の Unicode 変換フォーマットで、
    そのエンコーディング空間は Unicode のコードセット標準を参照します。
    このエンコーディング体系は UCS-4 とは異なります。
    なぜなら、Unicode のコード空間は 21 ビットまでに制限されるからです。
   </td>
   <td class="seg">
    この名前をエンコーディング変換の際に使用すると、
    先頭の BOM (バイトオーダーマーク)
    にもとづいてそれ以降のバイト列のエンディアンを識別します。
   </td>
  </tr>
   <tr class="seglistitem">
    <td class="seg">UTF-32BE</td>
    <td class="seg">Unicode</td>
    <td class="seg">上を参照ください。</td>
    <td class="seg">
     <code class="literal">UTF-32</code> とは対照的に、
     文字列が常にビッグエンディアン形式とみなされます。
    </td>
   </tr>
   <tr class="seglistitem">
    <td class="seg">UTF-32LE</td>
    <td class="seg">Unicode</td>
    <td class="seg">上を参照ください。</td>
    <td class="seg">
     <code class="literal">UTF-32</code> とは対照的に、
     文字列が常にリトルエンディアン形式とみなされます。
    </td>
   </tr>
   <tr class="seglistitem">
    <td class="seg">UTF-16</td>
    <td class="seg">Unicode</td>
    <td class="seg">
     16 ビット幅の Unicode 変換フォーマットです。
     注意すべき点は、UTF-16 の仕様が UCS-2 とは異なることです。
     なぜなら、Unicode 2.0 より導入されたサロゲート機能により、
     UTF-16 は現在 21 ビットコード空間を参照しているからです。
    </td>
    <td class="seg">
     この名前をエンコーディング変換の際に使用すると、
     先頭の BOM (バイトオーダーマーク)
     にもとづいてそれ以降のバイト列のエンディアンを識別します。
    </td>
   </tr>
   <tr class="seglistitem">
    <td class="seg">UTF-16BE</td>
    <td class="seg">Unicode</td>
    <td class="seg">
     上を参照ください。
    </td>
    <td class="seg">
     <code class="literal">UTF-16</code> とは対照的に、
     文字列が常にビッグエンディアン形式とみなされます。
    </td>
   </tr>
   <tr class="seglistitem">
    <td class="seg">UTF-16LE</td>
    <td class="seg">Unicode</td>
    <td class="seg">
     上を参照ください。
    </td>
    <td class="seg">
     <code class="literal">UTF-16</code> とは対照的に、
     文字列が常にリトルエンディアン形式とみなされます。
    </td>
   </tr>
   <tr class="seglistitem">
    <td class="seg">UTF-8</td>
    <td class="seg">Unicode / UCS</td>
    <td class="seg">
     8 ビット幅の Unicode 変換フォーマットです。
    </td>
    <td class="seg">none</td>
   </tr>
   <tr class="seglistitem">
    <td class="seg">UTF-7</td>
    <td class="seg">Unicode</td>
    <td class="seg">
     メールで安全に使用できる Unicode 変換フォーマットです。
     <a href="https://datatracker.ietf.org/doc/html/rfc2152" class="link external">&raquo;&nbsp;RFC2152</a> で定義されています。
    </td>
    <td class="seg">none</td>
   </tr>
   <tr class="seglistitem">
    <td class="seg">(none)</td>
    <td class="seg">Unicode</td>
    <td class="seg">
     UTF-7 の変化形です。
     <a href="https://datatracker.ietf.org/doc/html/rfc3501" class="link external">&raquo;&nbsp;IMAP プロトコル</a>
     での使用に特化しています。
    </td>
    <td class="seg">none</td>
   </tr>
   <tr class="seglistitem">
    <td class="seg">
     US-ASCII (推奨される MIME 名) / iso-ir-6 / ANSI_X3.4-1986 /
     ISO_646.irv:1991 / ASCII / ISO646-US / us / IBM367 / CP367 / csASCII
    </td>
    <td class="seg">ASCII / ISO 646</td>
    <td class="seg">
     American Standard Code for Information Interchange 
     は、一般的に使用される 7 ビットエンコーディングです。
     国際標準規格 ISO 646 として標準化されています。
    </td>
    <td class="seg">(none)</td>
   </tr>
   <tr class="seglistitem">
    <td class="seg">
     EUC-JP (推奨される MIME 名) /
     Extended_UNIX_Code_Packed_Format_for_Japanese / csEUCPkdFmtJapanese
    </td>
    <td class="seg">
     US-ASCII / JIS X0201:1997 (半角カナの部分) /
     JIS X0208:1990 / JIS X0212:1990 を合成したもの
    </td>
    <td class="seg">
     この名前が Extended UNIX Code Packed Format for Japanese
     を短縮したものであることからわかるように、
     一般的に UNIX 系のプラットフォームで用いられます。
     もととなるエンコーディング方式である Extended UNIX Code
     は、ISO 2022 にもとづいて設計されています。
    </td>
    <td class="seg">
     EUC-JP が参照している文字セットは IBM932 / CP932 のものとは異なります。
     これらはそれぞれ OS/2R および MicrosoftR WindowsR
     で用いられています。これらのプラットフォームとの間で情報をやり取りする場合は、
     代わりに EUCJP-WIN を使用してください。
    </td>
   </tr>
   <tr class="seglistitem">
    <td class="seg">Shift_JIS (推奨される MIME 名) / MS_Kanji / csShift_JIS</td>
    <td class="seg">JIS X0201:1997 / JIS X0208:1997 を合成したもの</td>
    <td class="seg">
     Shift_JIS が開発されたのは 80 年代初期です。
     当時は日本語ワープロが普及していたため、
     旧来のエンコーディング方式である JIS X 0201:1976
     との互換性を保つために開発されました。
     IANA の定義によると、Shift_JIS のコードセットは
     IBM932 / CP932 とは微妙に異なります。
     しかし、&quot;SJIS&quot; / &quot;Shift_JIS&quot; という名前は、
     これらのコードセットを表すものとしてしばしば誤用されています。
    </td>
    <td class="seg">CP932 コードマップを使用するには、代わりに SJIS-WIN を使用してください。</td>
   </tr>
   <tr class="seglistitem">
    <td class="seg">(none)</td>
    <td class="seg">
     JIS X0201:1997 / JIS X0208:1997 / IBM 拡張文字 / NEC 拡張文字
     を合成したもの
    </td>
    <td class="seg">
     この &quot;エンコーディング&quot; は EUC-JP
     と同じエンコーディング方式を使用しますが、
     もととなる文字セットが異なります。
     つまり、EUC-JP とは異なる文字に対応するコードポイントがあるということです。
    </td>
    <td class="seg">none</td>
   </tr>
   <tr class="seglistitem">
    <td class="seg">Windows-31J / csWindows31J</td>
    <td class="seg">
     JIS X0201:1997 / JIS X0208:1997 / IBM 拡張文字 / NEC 拡張文字
     を合成したもの
    </td>
    <td class="seg">
     この &quot;エンコーディング&quot; は Shift_JIS
     と同じエンコーディング方式を使用しますが、
     もととなる文字セットが異なります。
     つまり、Shift_JIS とは異なる文字に対応するコードポイントがあるということです。
    </td>
    <td class="seg">(none)</td>
   </tr>
   <tr class="seglistitem">
    <td class="seg">ISO-2022-JP (推奨される MIME 名) / csISO2022JP</td>
    <td class="seg">
     US-ASCII / JIS X0201:1976 / JIS X0208:1978 / JIS X0208:1983
    </td>
    <td class="seg"><a href="https://datatracker.ietf.org/doc/html/rfc1468" class="link external">&raquo;&nbsp;RFC1468</a></td>
    <td class="seg">(none)</td>
   </tr>
   <tr class="seglistitem">
    <td class="seg">JIS</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">ISO-8859-1</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">ISO-8859-2</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">ISO-8859-3</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">ISO-8859-4</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">ISO-8859-5</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">ISO-8859-6</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">ISO-8859-7</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">ISO-8859-8</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">ISO-8859-9</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">ISO-8859-10</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">ISO-8859-13</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">ISO-8859-14</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">ISO-8859-15</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">ISO-8859-16</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">byte2be</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">byte2le</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">byte4be</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">byte4le</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">BASE64</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">HTML-ENTITIES</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">7bit</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">8bit</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">EUC-CN</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">CP936</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">HZ</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">EUC-TW</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">CP950</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">BIG-5</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">EUC-KR</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">UHC (CP949)</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">ISO-2022-KR</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">Windows-1251 (CP1251)</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">Windows-1252 (CP1252)</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">CP866 (IBM866)</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">KOI8-R</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
   <tr class="seglistitem">
    <td class="seg">KOI8-U</td>
    <td class="seg">
    <td class="seg">
    <td class="seg">
   </tr>
  </tbody></table>
 </div>
<?php manual_footer($setup); ?>