文字コードを扱う必要があるため、調べたことをメモ取っていきます。

Shift JIS

第一バイト第二バイト文字数備考
0x81-0x9F0x40-0x7E,0x80-0xFC5828従来の JIS第一、第二水準領域 合計 8836 文字
0xE0-0xEF0x40-0x7E,0x80-0xFC3008
0xF0-0xFC0x40-0x7E,0x80-0xFC2444従来の拡張用領域

EUC

Extended UNIX Code 日本語UNIXシステム諮問委員会の提案に基づいて1985年にAT&T社が定めた、複数バイトの文字を扱う文字コードの枠組み。日本語だけでなく複数バイト言語の各国の文字コードが規定されている。日本語のEUCを特に「EUC-JP」「日本語EUC」と呼ぶこともある。

日本語以外には、韓国語、中国語二種(繁体字中国語、簡体字中国語)が定義されている。コード名は EUCCN, EUCJP, EUCKR, EUCTW

制御コード

   0x00〜0x1F、0x7F 

ASCII文字

   0x20〜0x7E 

漢字

   0xA1A1〜0xFEFE (第1バイト・第2バイトとも0xA1〜0xFE) 

半角カタカナ

   0x8EA1〜0x8EDF 

補助漢字

   0x8FA1A1〜0x8FFEFE (第2バイト・第3バイトとも0xA1〜0xFE)

文字コード全般に関するリンク


トップ   差分 バックアップ リロード   一覧 単語検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2013-10-27 (日) 17:45:31 (1488d)