Character encoding (文字エンコーディング)
エンコーディングはバイト列と文字を対応付けるものです。バイトの並びは文字としてさまざまに解釈できます。特定のエンコーディング(UTF-8 など)を設定することで、バイトの並びがどのように解釈されるかを定めることができます。
例えば、 HTML ではふつう以下のような行を使って UTF-8 の文字エンコーディングを宣言します。
html
<meta charset="utf-8" />
これで HTML 文書であらゆる自然言語の文字を使用できるようになり、確実に表示されるようになります。
関連情報
一般知識
- W3C の文字エンコーディング
- ウィキペディアの文字エンコーディング