Top / 文字コード
HTML convert time: 0.024 sec.

文字コード

Last-modified: 2014-09-25 (木) 19:47:38

一覧

文字セット(文字集合)符号化方式C言語の型文字列リテラル概要
シングルバイト文字(SBCS)ASCII(7bit)charなし1文字を1byteで表す符号化方式
ISO-8859(8bit)
ダブルバイト文字(DBCS)-charなし1文字を2byteで表す符号化方式
マルチバイト文字(MBCS)
JIS X 0208
Shift_JIScharなし1文字を1〜2byte以上で表す符号化方式
上記シングルとダブルを含んだ文字セット
EUC-JP
ISO-2022-JP
Unicode
ISO/IEC 10646
UTF-8charu8"utf-8 string"1文字を1〜6byteで表す符号化方式
UTF-16char16_tu"utf-16 string"1文字を2〜4byteで表す符号化方式
UTF-32char32_tU"utf-32 string"1文字を4byteで表す符号化方式
ワイド文字UTF-16(Windows)wchar_tL"wide char"UTF-16の項を参照
UTF-32(Linux/Mac)wchar_tL"wide char"UTF-32の項を参照
  • 規格上、wchar_tの内部表現はUnicodeである必要はない
    しかしWindowsではUTF-16、LinuxではUTF-32を用いている

SJISとEUC

  • SJISとEUCは1~2byteで構成されるがエンディアンという考え方はない
    バイトストリームを先頭から1byteずつ読んで処理するのみ

リンク

UTF8