Unicodeとは

Unicodeは、世界中の書き言葉で使用されるすべての文字に一意の番号(コードポイントと呼ばれます)を割り当てる、普遍的な文字エンコーディング標準です。128文字のみをサポートしていたASCIIなどの古いエンコーディングシステムとは異なり、Unicodeは100万文字以上を表現できます。これには、すべてのアルファベットの文字、記号、絵文字、特殊文字が含まれます。これにより、異なる言語とプラットフォーム全体で機能するソフトウェアを構築するために不可欠です。

Unicodeコードポイントは通常、U+の後に16進数が続く形式で記述されます。例えば、文字「A」はU+0041であり、絵文字😀はU+1F600です。異なるプログラミング言語とシステムはこれらのコードポイントをさまざまな形式で表現するため、形式間の変換が必要になることがよくあります。

ツール説明

このツールは、プレーンテキストとさまざまなUnicode表現形式の間でテキストを変換します。プレーンテキスト、Unicodeコードポイント、JavaScript エスケープシーケンス、HTML数値エンティティ、16進数値、10進数値の6つの異なる形式間の双方向変換をサポートしています。入力形式と出力形式を選択するだけで、変換が即座に行われます。

入力 形式 出力
Hello コードポイント U+0048 U+0065 U+006C U+006C U+006F
Hello JS エスケープ \u0048\u0065\u006C\u006C\u006F
Hello HTML エンティティ Hello
Hello 16進数 0048 0065 006C 006C 006F
Hello 10進数 72 101 108 108 111
😀 コードポイント U+1F600
Привет JS エスケープ \u041F\u0440\u0438\u0432\u0435\u0442

機能

  • 6つのUnicode形式すべての間での双方向変換
  • 完全なUnicodeサポート(基本多言語面(BMP)外の絵文字と文字を含む)
  • サロゲートペアの処理(U+FFFF以上の文字を含むJavaScript エスケープシーケンス用)
  • リアルタイム変換(入力時に即座に結果を表示)
  • コピーとスワップ機能(変換を素早く逆にする)

ユースケース

  • Web開発:特殊文字をHTMLエンティティに変換して、Webページで安全に表示
  • JavaScript/JSONエンコーディング:非ASCII文字をエスケープしてJavaScript文字列またはJSONファイルで使用
  • エンコーディングの問題のデバッグ:文字の正確なコードポイントを検査して、テキストエンコーディングの問題を診断
  • クロスプラットフォームテキスト処理:文字を数値形式に変換して、ネイティブにUnicodeをサポートしていないシステムで使用
  • Unicodeの学習:異なる文字がさまざまなエンコーディング形式でどのように表現されるかを探索