はじめに
こんにちは!今日は文字コード解析ツールを作ったので紹介します!
リアルタイム文字コード解析ツール
ツールの利用方法
文字コード解析部長はWebアプリです。どの環境からでも利用できます。
リアルタイム文字コード解析ツール(文字コード解析部長)を利用してみる。
機能
入力した文字に対して、リアルタイムで以下の情報を表示します。
- 漢字コード
- 句点番号
- 面句点番号
- エンコード情報
- ISO-2022-JP
- EUC-JP
- Shift_JIS
- Windows-31J (CP932)
- Shift_JIS-2004
- Unicode
- UTF-8
- UTF-16
- UTF-32
- CJK情報
- 備考
- 常用漢字/人名用漢字
- JIS漢字水準
- 第1水準、第2水準、第3水準、第4水準
- サロゲートペア判定
- ひらがな・カタカナ・絵文字・顔文字
- Windows-31J情報
- NEC特殊文字判定
- IBM拡張文字判定
名前について
文字コード解析部長について
インパクトがある名前で、覚えやすいような名前ということで、このような名前にしました。最初は「文字コード解析くん」という親しみやすい名前にしようと考えたのですが、インパクトが足りないということで、こっちの名前をある方からオススメされました。
リアルタイム文字コード解析ツール
ただ検索しにくいこともあり、現在は上記の「リアルタイム文字コード解析ツール」という名前にしております。アイキャッチ画像は修正が大変だったのでとりあえずそのままです。
なぜ作ったのか?
名前を使うシステムを考えていると、色々な疑問点がわいてきます。
- 「Shift_JIS」って第〇水準のどの漢字まで使えるのか
- 人名用漢字は対応しているのか。
- 圡(ひじ)の対応
- 髙(はしごだか)の対応
- 𠮷(つちよし)の対応
色々疑問点がわきます。以下のような記事を作成して、調査したこともありました。
さらに理解を深めようと、色々な文字がどの水準なのかすぐに調査したい思ったのですが、そのようなツールは存在しなく自分で作ってみることにしました。
文字コードと漢字水準の関係
ツールを作るにあたって、文字コードと漢字水準、常用漢字、人名用漢字の理解を深めることができたため、以下のような図を作ることが出来ました。
参考
- Wikipedia – en:Shift JIS
- Wikipedia – JIS X 0213非漢字一覧
- Wikipedia – JIS X 0213漢字一覧の1面
- Wikipedia – JIS X 0213漢字一覧の2面
- Wikipedia – 常用漢字
- Wikipedia – 常用漢字一覧
- Wikipedia – 人名用漢字
- Wikipedia – 人名用漢字一覧
- Wikipedia – ブロック (Unicode)
- snaka – 文字コード(UTF-8,Shift_JIS,EUC-JP,ISO-2022-JP)についての俺的まとめ
コメント