文字化け修復ツール

文字コード自動判定・エンコーディング変換で文字化けを修復

文字化けしたテキストを貼り付けるだけで、考えられるエンコーディングの組み合わせを自動的に試し、正しく読めるテキスト候補を一覧表示します。入力したデータはブラウザ内のみで処理され、サーバーには一切送信されません。

サンプルで試す:

文字化けしたテキストを入力してください

使い方

1

文字化けテキストを貼り付け

メールやWebサイトなどからコピーした文字化けテキストを入力欄にペーストします。

2

「修復する」をクリック

ボタンを押すと、主要なエンコーディングの組み合わせを自動的に試します。

3

正しい候補をコピー

修復候補の中から正しく読めるテキストを見つけ、コピーボタンで取得します。

文字化けとは

文字化け(もじばけ)とは、コンピューター上でテキストデータが意図しない文字列として表示される現象のことです。 たとえば「文字化け」という日本語テキストが「文字化ã'」のように表示されたり、「繧ュ繝シ繝懊・繝峨」のように読めない文字列になることがあります。

文字化けの主な原因は、テキストを保存したときのエンコーディング(文字コード)と、読み取るときのエンコーディングが異なることにあります。 日本語環境では、UTF-8・Shift_JIS・EUC-JP・ISO-2022-JPなど複数のエンコーディングが歴史的に使われてきたため、文字化けが特に発生しやすい状況にあります。

主な文字コードの歴史

日本語のコンピューター処理は1970年代に始まりました。当初はJIS X 0208(旧JIS C 6226)として日本語文字セットが規格化され、これをベースに各環境向けのエンコーディングが開発されました。

Shift_JISはマイクロソフトとアスキーが1980年代初頭にMS-DOS向けに策定した符号化方式で、Windows環境で長年標準的に使用されました。 EUC-JPはUNIX系システムで標準的に使われた符号化方式で、日本語テキストをASCIIと共存させるために設計されました。 ISO-2022-JPは電子メールでの日本語テキスト送受信のために設計されたエンコーディングで、エスケープシーケンスによって文字セットを切り替える仕組みを持ちます。

2000年代以降、Web標準としてUTF-8が広く普及し、現在ではほとんどのWebサイトやメールシステムがUTF-8を採用しています。 しかし古いシステムやファイルとのやり取りでは依然として文字化けが発生することがあり、本ツールはそのような場面で活用いただけます。

文字化けの典型的なパターン

UTF-8テキストをLatin-1として読んだ場合

表示例(クリックで修復を試す)

UTF-8でエンコードされたバイト列を、Latin-1(ISO-8859-1)として解釈した場合に発生します。WebブラウザやメールクライアントでUTF-8のページをLatin-1で開くと、このようなパターンの文字化けが起こります。各バイトがそのままLatin-1の文字に変換されるため、マルチバイト文字が複数のLatin-1文字として表示されます。

UTF-8テキストをShift_JISとして読んだ場合

表示例(クリックで修復を試す)

UTF-8でエンコードされたバイト列をShift_JISとして解釈した場合に発生します。漢字や記号が混ざった読めない文字列になります。古いWindowsアプリケーションで作成したCSVファイルをモダンなWebアプリで開いた場合などに見られるパターンです。

Shift_JISテキストをLatin-1として読んだ場合

表示例(クリックで修復を試す)

Shift_JISでエンコードされたバイト列がLatin-1として解釈された場合に発生します。記号やアクセント付き文字の混在した文字列として表示されます。

EUC-JPテキストをLatin-1として読んだ場合

表示例(クリックで修復を試す)

UNIX系サーバーから送信されたEUC-JPテキストが、Latin-1として解釈された場合に発生します。EUC-JPのバイト値はLatin-1のアクセント記号やキリル文字の範囲と重なるため、外国語のように見えることがあります。

本ツールの仕組み

本ツールは、入力されたテキストに対して複数のエンコーディング変換パターンを順に適用します。 まず入力テキストをあるエンコーディングのバイト列として解釈し、次にそのバイト列を別のエンコーディングでデコードします。 この二重変換を主要なエンコーディングの全組み合わせ(Shift_JIS、EUC-JP、ISO-2022-JP、UTF-8、Latin-1など)について試行し、 日本語として読める結果のみを候補として表示します。ブラウザのTextDecoder APIを使用しているため、すべての処理がクライアント側で完結します。

よくある質問

どんなエンコーディングに対応していますか?

UTF-8、Shift_JIS(Windows-31J)、EUC-JP、ISO-2022-JP、Latin-1(ISO-8859-1)のエンコード・デコードの組み合わせに対応しています。日本語の文字化けの大半はこれらのエンコーディング間の誤変換が原因です。

修復候補が複数表示されますが、どれを選べばよいですか?

表示された候補のうち、もとのテキストとして自然に読めるものを選んでください。日本語として意味が通る文章になっているものが正解です。候補には変換に使用したエンコーディングペア(例:Latin-1→UTF-8)が表示されるので、同じ原因の文字化けが再発した際の参考にもなります。

修復できない文字化けはありますか?

バイト列が欠損している場合や、複数回の誤変換が重ねて適用されている場合は修復が困難です。また、元のテキストがバイナリデータの一部である場合も復元できません。置換文字(?や□)に変換された時点でバイト情報が失われるため、そのようなケースでは元のファイルからやり直す必要があります。

メールの文字化けも修復できますか?

メール本文の文字化けであれば、テキストをコピーして本ツールに貼り付けることで修復を試みることができます。ただし、メールヘッダのContent-Typeで指定されたエンコーディングとは異なるエンコーディングで送信された場合など、メール特有の問題もあります。ISO-2022-JPは特にメールで多用されるエンコーディングで、本ツールはこの形式にも対応しています。

入力したデータは保存・送信されますか?

いいえ。すべてのデータはブラウザ内のみで処理され、サーバーに送信されることは一切ありません。ページを閉じるとデータは消えます。

無料で使えますか?

はい、完全無料です。登録やアカウント作成も不要です。

スマートフォンでも使えますか?

はい、スマートフォン・タブレット・PCなど、ブラウザが使えるすべてのデバイスに対応しています。

データについて

このツールは時効性のないデータのみを使用しています。計算式や変換係数は普遍的な値に基づいており、定期的な更新は不要です。

入力データはブラウザ内のみで処理されます。サーバーへの送信は一切ありません。