文字コードを扱う必要があるため、調べたことをメモ取っていきます。 Shift JIS †
EUC †Extended UNIX Code 日本語UNIXシステム諮問委員会の提案に基づいて1985年にAT&T社が定めた、複数バイトの文字を扱う文字コードの枠組み。日本語だけでなく複数バイト言語の各国の文字コードが規定されている。日本語のEUCを特に「EUC-JP」「日本語EUC」と呼ぶこともある。 日本語以外には、韓国語、中国語二種(繁体字中国語、簡体字中国語)が定義されている。コード名は EUCCN, EUCJP, EUCKR, EUCTW 制御コード 0x00〜0x1F、0x7F ASCII文字 0x20〜0x7E 漢字 0xA1A1〜0xFEFE (第1バイト・第2バイトとも0xA1〜0xFE) 半角カタカナ 0x8EA1〜0x8EDF 補助漢字 0x8FA1A1〜0x8FFEFE (第2バイト・第3バイトとも0xA1〜0xFE) 文字コード全般に関するリンク † |