文字コード確認・チェッカー
テキストファイルの文字コード(UTF-8/Shift_JIS/EUC-JP)を自動判定する文字コードチェッカー
クリックまたはドラッグ&ドロップ
.txt / .csv / .tsv / .log など(最大20MB)
詳しく読む — 関連ガイド記事
ガイド記事
CSVの文字化けはなぜ起きる?Shift_JISとUTF-8の違いを図解
ExcelでCSVを開くと文字化けする根本原因と、Shift_JIS・UTF-8・BOMの関係をエンジニア以外にも分かる形で解説。
ガイド記事
全角・半角の違いと変換 — 日本語入力でつまずかないための基礎
全角「123」と半角「123」の起源(JIS)とUnicodeでの扱い、フォームで「半角で入力してください」と求められる理由、住所・電話番号・カタカナ変換の実務的な使い分けを解説。
ガイド記事
改行コード CRLF・LF・CR の違い — OS間でテキストが崩れる理由
Windows(CRLF)・macOS/Linux(LF)・古いMac(CR)で改行コードが違う歴史的経緯と、ExcelでCSVを開くと行が崩れる・Gitで差分が出る・テキストが1行に繋がるなどの実トラブルと対処法を解説。
ガイド記事
確定申告の銀行・証券CSV文字化けを直す方法(Shift_JIS↔UTF-8)
確定申告で銀行・証券会社からダウンロードしたCSVが文字化けする原因と解決方法を解説。Shift_JIS↔UTF-8変換、Excelで正しく開く手順、ブラウザ完結で機密データを安全に処理する方法を紹介。
ガイド記事
テキストファイルの文字化けを直す方法 — UTF-8・Shift_JIS・EUC-JPの変換手順
メモ帳・テキストエディタで開くと文字化けするファイルの直し方を解説。UTF-8・Shift_JIS・EUC-JPの見分け方から変換手順まで。
よくある質問
対応している文字コードは何ですか?
UTF-8(BOMあり・なし)、Shift_JIS(Windows-31J)、EUC-JP、UTF-16(BOMあり)の判定に対応しています。日本語テキストファイルで一般的に使われる文字コードをカバーしています。
判定の信頼度とは何ですか?
バイトパターンの特徴がどれだけ明確に検出されたかを示す指標です。BOMが存在する場合は「確実」、特徴的なバイトパターンが多く検出された場合は「高」、少ない場合は「中」と表示されます。テキストが短い・全ASCII文字のみの場合は判定精度が下がることがあります。
ファイルはサーバーに送信されますか?
いいえ、すべての処理はお使いのブラウザ内で完結します。アップロードしたファイルが外部サーバーに送信されることはありません。
対応しているファイル形式は何ですか?
.txt、.csv、.tsv、.log、.md、.htmlなどテキストファイル全般に対応しています。バイナリファイル(PDF・画像など)は正しく判定できません。
文字コードを変換したい場合はどうすればいいですか?
CSVファイルの場合は「CSV文字コード変換」ツールをご利用ください。Shift_JIS↔UTF-8の変換に対応しています。
全角・半角の英数字のみのファイルで判定が「不明」になります
ASCII文字(0x00〜0x7F)はUTF-8・Shift_JIS・EUC-JPすべてで共通のバイト表現を持つため、ASCII文字のみのファイルは文字コードを判定できません。日本語を含むファイルで試してください。
開発者ツール一覧
すべて見るこのツールについて
使い方
- テキストファイル(.txt / .csv / .log など)をドラッグ&ドロップ、またはクリックして選択する
- ファイルを選択すると自動で文字コードが解析される(ボタン操作は不要)
- 検出された文字コードと信頼度、テキストプレビューが表示される
- Shift_JIS または UTF-8 と判定された場合は、CSV文字コード変換ツールへのリンクも表示される
このツールの特徴
- ✓BOMの有無まで正確に判定:UTF-8 BOM付き(0xEF BB BF)・UTF-16 BOM付き(0xFF FE / 0xFE FF)をBOMなしのUTF-8と区別して検出します。ExcelがBOM付きUTF-8を要求するケースでも確実に確認できます
- ✓バイトパターンスコアリングによる判定:BOMがない場合は、UTF-8・Shift_JIS・EUC-JPそれぞれに特有のバイトパターンを解析してスコアリングし、最も可能性の高い文字コードを判定します
- ✓判定の信頼度を表示:「確実」「高」「中」「低」で判定の確からしさを表示。スコアが拮抗している場合は信頼度が下がるため、結果の参考度合いが把握できます
- ✓テキストプレビューで目視確認:判定結果だけでなく、実際にそのエンコードでデコードした先頭500文字を表示。文字化けが発生していれば視覚的にすぐ確認できます
- ✓ファイルをサーバーに送信しない:すべての処理はブラウザ内で完結。個人情報を含むCSVや社内文書も安心してアップロードできます
こんなときに便利
- •Excelで開いたCSVが文字化けしていて、元ファイルの文字コードを確認したいとき(日本語CSVはShift_JISとUTF-8が混在しやすい)
- •古いシステムから出力されたテキストファイルがどの文字コードで保存されているかを調べたいとき
- •Webサイトやアプリに取り込むテキストデータが期待通りの文字コード(通常UTF-8)になっているか検証したいとき
- •テキストエディタを開かずに、ファイルをドロップするだけで素早く文字コードを確認したいとき
UTF-8 / Shift_JIS / EUC-JPの違い
日本語テキストファイルで主に使われる3つの文字コードには、それぞれ特徴があります。UTF-8は現在の標準で、Webブラウザ・LinuxOS・モダンなアプリケーションはほぼすべてUTF-8を使います。Shift_JISはWindowsの日本語環境で長年使われてきたエンコードで、ExcelのCSV出力がデフォルトでShift_JISを使うため、業務システムで今も多く見られます。EUC-JPは主に古いLinuxや日本語Unixシステムで使われていたエンコードです。文字化けの多くは、作成時と読み込み時の文字コードが一致していないことが原因です。