テキスト文字コード変換
テキスト・ログファイルのShift_JIS↔UTF-8↔EUC-JPをブラウザ内で変換
クリックまたはドラッグ&ドロップ
.txt / .log / .tsv / .csv / .md など(最大20MB)
次のステップ
CSVファイルの文字コード変換
CSVに特化した変換ツール。Shift_JIS↔UTF-8対応。
よくある質問
対応している文字コードは何ですか?
UTF-8(BOMあり・なし)、Shift_JIS(Windows-31J)、EUC-JPの3種類に対応しています。変換元・変換先ともに選択できます。自動検出モードではBOMパターンとバイトスコアリングにより最も可能性の高い文字コードを判定します。
自動検出の精度はどの程度ですか?
BOM(バイトオーダーマーク)が付いているファイルは「確実」に判定できます。BOMなしのファイルは、UTF-8・Shift_JIS・EUC-JPそれぞれに特有のバイトパターンをスコアリングして判定します。日本語を多く含む文書では高精度ですが、ASCII文字のみのファイルは判定できません。判定に自信がない場合は「文字コード確認ツール」で事前に確認することをおすすめします。
CSVファイルも変換できますか?
はい、.csv は対応ファイル形式に含まれています。ただし、CSVファイルの変換には専用の「CSV文字コード変換」ツールもご利用いただけます。CSV専用ツールではShift_JIS↔UTF-8の変換に特化しており、Excelとの連携も考慮した設計になっています。
ファイルはサーバーに送信されますか?
いいえ、すべての処理はお使いのブラウザ内で完結します。アップロードしたファイルが外部サーバーに送信されることは一切ありません。個人情報・社内機密を含むファイルも安心してご利用いただけます。
UTF-8とShift_JISの違いは何ですか?
UTF-8はWebブラウザ・Linux・モダンなアプリケーションの標準文字コードです。Shift_JISはWindows日本語環境の従来標準で、ExcelのCSV出力がデフォルトでShift_JISを使用します。同じ日本語テキストでも、UTF-8では1文字3バイト、Shift_JISでは2バイトで表現されます。文字化けの多くはこの2つの混在が原因です。
Excelで開くと文字化けするCSVの対処法は?
ExcelはデフォルトでShift_JISとしてCSVを開きます。UTF-8で保存されたCSVをExcelで開くと文字化けします。対処法は2つあります。①このツールでUTF-8→Shift_JISに変換してからExcelで開く。②ExcelのデータインポートウィザードでUTF-8を指定して読み込む。変換後はShift_JISで保存されるため、Excelで正常に表示されます。
EUC-JPとはどんな文字コードですか?
EUC-JP(Extended Unix Code for Japanese)は、1990年代のUnix・Linuxシステムで標準的に使われた日本語文字コードです。現在でも古いLinuxサーバーのログファイルや、レガシーシステムから出力されたファイルで見られます。Web・WindowsではほぼUTF-8またはShift_JISに移行していますが、社内の旧システムでは今もEUC-JPが使われているケースがあります。
変換後のファイル名はどうなりますか?
元のファイル名の先頭に「変換済み_」を付けた名前でダウンロードされます。例えば「data.txt」を変換すると「変換済み_data.txt」として保存されます。元のファイルは上書きされないため、変換前後のファイルを比較することができます。
ファイルツール一覧
すべて見るこのツールについて
使い方
- テキストファイル(.txt / .log / .tsv / .csv など)をドラッグ&ドロップ、またはクリックして選択する
- 変換元の文字コードを確認する(自動検出の場合はそのままでOK)
- 変換先の文字コードを選択する(UTF-8 / Shift_JIS / EUC-JP)
- 「文字コードを変換する」ボタンをクリックする
- 変換後プレビューを確認し、「ダウンロード」ボタンで保存する
このツールの特徴
- ✓ブラウザ内で完結:変換処理はすべてブラウザ上で実行されます。ファイルは外部サーバーに送信されないため、個人情報・社内機密文書も安心してご利用いただけます
- ✓自動検出で手間いらず:ファイルをアップロードするだけで文字コードを自動判定します。BOMが付いているファイルは確実に、日本語テキストはバイトパターンスコアリングで高精度に判定します
- ✓encoding-japaneseライブラリで高精度変換:MIT ライセンスの信頼性の高いライブラリ「encoding-japanese」を使用し、Shift_JIS・EUC-JPへの書き出しも正確に行います。Web標準の TextEncoder が非対応の文字コードも安心して変換できます
- ✓変換後プレビューで確認できる:ダウンロード前に変換後テキストの先頭300文字をプレビュー表示。変換が正しく行われているかを目視で確認してからダウンロードできます
- ✓元ファイル名を保持:ダウンロードされるファイル名は「変換済み_元ファイル名」の形式で保存されます。元のファイルと変換後ファイルを区別しやすい設計です
こんなときに便利
- •業務システムから出力されたShift_JISのテキストファイルをUTF-8に変換してWebサービスに取り込みたいとき
- •古いLinuxサーバーから取得したEUC-JPのログファイルをUTF-8に変換してモダンなエディタや解析ツールで読みたいとき
- •UTF-8で作成したテキストをWindows環境(メモ帳やExcel)で正しく開くためShift_JISに変換したいとき
- •テキストエディタ(VSCodeなど)でファイルを開いたら文字化けしており、文字コードを変換して正常に表示したいとき
UTF-8 / Shift_JIS / EUC-JPの技術的背景
日本語のデジタル処理には、文字をコンピュータ上でどのようなバイト列として表現するかを定めた「文字コード」の規格が複数存在します。これらが混在することで文字化けが発生します。
UTF-8は1992年に策定されたUnicode準拠の文字コードで、世界中のほぼすべての文字を表現できます。現在のWebブラウザ・LinuxOS・モダンなプログラミング言語はUTF-8を標準としており、新規システムではUTF-8一択です。日本語1文字を3バイトで表現します。
Shift_JISはMicrosoftと旧ASCIIが1982年に策定した日本語専用文字コードです。Windowsの日本語環境で長年標準として使われてきたため、日本企業の基幹システム・ExcelのCSV出力・旧来のWebサイトで今も広く使われています。日本語1文字を2バイトで表現し、半角カナも扱えます。
EUC-JP(Extended Unix Code for Japanese)は、1990年代のUnix・Linux環境で標準的に使われた日本語文字コードです。現代のLinuxはUTF-8に移行しましたが、レガシーなサーバー・データベース・業務システムでは今もEUC-JPが使われているケースがあります。文字化けの多くは、これら3つの文字コードが混在した環境で発生します。