ぱんだツールズぱんだツールズ

文字コード・エンコーディング

e-Taxで使うCSV/XMLデータの整形ガイド — 提出データの作り方と注意点

約7分

年末調整後の法定調書、消費税申告、源泉徴収票—— e-Tax(国税電子申告・納税システム)に取り込もうとしたCSVが「形式エラー」で弾かれた経験はありませんか? e-Taxは取り込みデータの形式が非常に厳密で、文字コードが違う・カンマが1つ多い・改行コードがLFになっている、といった わずかなズレでも受け付けてくれません。この記事では、実務でつまずきやすいCSV/XMLの整形ポイントを、 ブラウザ内で完結する整形ツールの使い方とあわせて整理します。

先にお伝えしておきたいこと

e-Taxの仕様(列構成・文字コード・項目定義など)は手続きごとに異なり、年度ごとに改定されることがあります。 本記事は一般的な詰まりポイントの整理を目的としており、個別の項目数や桁数は断定しません。 提出前には必ず国税庁公式の最新仕様書を参照してください。

e-Taxには3つの入力経路がある

まず押さえておきたいのは、e-Taxへのデータ投入には大きく3つの経路があるという点です。 どれを使うかで、整形すべきデータ形式がまったく変わります。

  • 直接入力 — e-Taxソフト(WEB版/ダウンロード版)の画面で1件ずつフォーム入力する方法。 件数が少ない個人事業主・小規模事業者向け。CSVの整形は不要です。
  • CSV取り込み — 法定調書合計表・源泉徴収票などで、所定のレイアウトに沿ったCSVを取り込む方法。 会計ソフト・給与計算ソフトからCSV出力して使うのが一般的です。
  • XMLインポート — 主にシステム連携・大量データ向け。スキーマに準拠したXMLを生成して送信します。 市販の税務ソフト経由で扱うのが現実的です。

CSVとXMLの違い

CSVとXMLは、同じ「データを電子的に渡す」ためのフォーマットですが性格が違います。比較すると次の通りです。

データ形式主な用途注意点
CSV法定調書(給与・報酬・支払調書)/源泉徴収票/消費税申告 など列順・列数・文字コード・改行コードが厳密。Excelで開くと先頭ゼロが消える等の事故が起きやすい
XMLシステム連携での一括送信・大量データの提出スキーマ(XSD)に厳密準拠が必要。手書きせず税務ソフトで生成するのが基本
直接入力件数が少ない個人事業主/単発の手続き手間はかかるが整形不要。e-Taxソフトのバリデーションが効くため事故が少ない

以下の節では、実務で扱う頻度が圧倒的に多いCSVについて、現場で詰まりやすい ポイントを順に見ていきます。

e-Tax CSVが厳密である理由

e-Taxは税務申告という性質上、取り込んだデータをそのまま行政システムに登録する仕組みになっています。 フォーマットが少しでも崩れていると、後続の集計や法定保管に影響が出るため、入口で厳しくバリデーションしています。

逆に言うと、仕様書通りに整形さえできれば取り込めるということでもあります。 「自社のシステムから出てきたCSVをそのまま投げる」のではなく、 「e-Taxの仕様にきっちり合わせてから投げる」工程が必要、と考えるのが安全です。

CSVで詰まりやすいポイント5つ

① 文字コード(多くがShift_JIS指定)

e-Taxで取り込むCSVは多くがShift_JIS(CP932)を前提としています。 Excelで作成・保存したCSVは既定でShift_JISになりますが、メモ帳やGoogleスプレッドシート経由で 編集するとUTF-8に変わり、取り込み時に「文字コード不正」「文字化け」のエラーが発生します。

ブラウザ上で確認・変換するなら、CSV文字コード変換ツールでShift_JIS↔UTF-8を切り替えられます。マイナンバーや給与情報を含むCSVでもファイルはサーバーに送信されません。 文字化けの一般的な仕組みについてはCSV文字化けの仕組みと直し方でも詳しく解説しています。

② 改行コード(CRLF か LF か)

e-Taxの法定調書CSVは一般的にCRLF(Windows形式)が前提です。 macOSやLinuxで保存したCSVはLFのみになっていることが多く、 「最終行が読み込まれない」「行数が想定と合わない」といった症状の原因になります。 テキストエディタの改行コード変換機能や、改行コード変換ツールでCRLFに揃えてから取り込んでください。

③ カラム数の過不足

e-Tax CSVの取り込みは、仕様書で定義されたカラム数と1つでも違うと弾かれます。 頻発する原因は次の3パターンです。

  • Excelで保存する際に、データの右側に空白列が含まれていて余分なカンマが付与される
  • 氏名や住所にカンマが含まれていて、ダブルクォートでエスケープされていない
  • 仕様書にある「予備項目」「将来用フィールド」を空欄として書き出していない

列の整理はCSV列並び替え・削除ツールで行えます。仕様書のカラム順に揃えたうえで、CSV↔Excel変換ツールでExcelとの行き来をするとカラムずれが起きにくくなります。

④ 全角・半角の混在

e-Taxの項目定義では、項目ごとに「全角」「半角」が指定されています。 氏名・住所は全角、電話番号や金額は半角、というのが典型ですが、 Excelでコピペを繰り返すと全角スペースや全角数字が紛れ込みがちです。 本サイトの全角・半角変換ツールで、数字・英字部分だけ半角に揃えると事故を減らせます。

⑤ 空白セルや先頭ゼロの扱い

CSVの空白セルは「空文字」と「半角スペース」で扱いが変わるケースがあります。 また郵便番号や口座番号など先頭が0で始まるデータをExcelで開くと、ゼロが消えて 「100-0001」が「1000001」になり、桁数チェックで弾かれることがあります。 ExcelでCSVを編集する場合はセルの書式を「文字列」にしてから貼り付けるか、 Power Queryの「テキスト/CSVから」インポートを使ってください。

仕様確認の手順(毎回必ず行う)

CSVを書き出す前に、提出する手続きと年度に対応した仕様書を確認するのが事故を防ぐ最短ルートです。

  1. 国税庁ホームページの「e-Tax」「法定調書関係」コーナーから、提出する手続きの仕様書を探す
  2. 提出年度(令和●年分)の最新版であることを確認する
  3. 文字コード・改行コード・カラム数・必須項目・全角半角の指定をメモする
  4. 会計・給与ソフトのCSV出力フォーマットがその仕様に対応しているかを確認する
  5. テスト送信機能で1件だけ試送し、エラーが出ないことを確認する

過去年に作ったテンプレートをそのまま使うと、軽微なフォーマット改定を見落として一括エラーになりがちです。 毎年「仕様書を見る」ところから始めるのが結局いちばん早道です。

XMLでの提出について

XMLでの提出は、主に大量データの一括送信やシステム間連携で使われます。 国税庁が公開しているXMLスキーマ(XSD)に準拠した文書を作る必要があり、 要素の順序・名前空間・必須属性などCSVよりも厳密です。

XMLを自社で組み立てるとスキーマ検証や電子署名の組み込みで工数がかさむため、 XML対応をうたっている市販の税務ソフト・会計ソフトの利用が一般的です。 個人事業主や小規模法人ではCSVまたは直接入力で十分なケースがほとんどです。

関連ツール

e-Tax提出データの整形でよく使う、ぱんだツールズの関連ツールをまとめました。 いずれもブラウザ内処理で、ファイルはサーバーに送信されません。

まとめ

  • e-Taxへの投入経路は「直接入力」「CSV取り込み」「XMLインポート」の3つ
  • CSV取り込みは件数が多い場合の現実解だが、文字コード・改行コード・カラム数・全角半角が厳密
  • 多くのCSVがShift_JIS+CRLFを前提としており、macOS・スプレッドシート経由の編集で崩れやすい
  • XMLは大量データ・システム連携向け。市販の税務ソフト経由で扱うのが現実的
  • 仕様は年度ごとに改定されるため、提出前には必ず国税庁公式の最新仕様書を参照する
  • 本記事の手順通りでも100%の受理は保証できない。テスト送信と最新仕様書の確認をセットで行う

よくある質問

e-Tax用のCSVは文字コードを何にすればいいですか?

e-Taxで取り込む多くのCSVは「Shift_JIS(CP932)」が指定されています。Excelで作成したCSVは既定でShift_JISになるため一見大丈夫に見えますが、メモ帳やGoogleスプレッドシートで保存し直すとUTF-8に変わってしまい取り込み時にエラーになる例が多いです。最新の正確なエンコーディング指定は国税庁が公開している各手続きの仕様書を必ず確認してください。

CSVの改行コードはCRLFとLFどちらが正しいですか?

e-Taxの法定調書CSVは一般的にCRLF(Windows形式)が前提とされています。macOSやLinuxで保存したCSVはLFになっていることが多く、行が認識されない・最終行がスキップされるといった現象が起きます。テキストエディタの「改行コード変換」機能や、本サイトの改行コード変換ツールで揃えてから取り込むのが安全です。

法定調書CSVの列構成はどこで確認できますか?

国税庁ホームページの「法定調書関係」「e-Tax仕様公開資料」ページに、各手続きごとのCSVレイアウト(列番号・項目名・桁数・必須/任意)が公開されています。年度ごとに改定されることがあるため、過去年に作ったテンプレートをそのまま使うのは危険です。提出年度に合った最新仕様書を毎回参照してください。

XMLでの提出とCSVでの提出はどちらが楽ですか?

件数が少なく手作業で済む場合はe-Taxソフト・WEB版の直接入力が最も簡単です。件数が多い場合はCSV取り込みが現実的で、会計ソフトや給与システムからCSVを書き出す運用が一般的です。XMLは主にシステム連携・大量データの一括送信向けで、自社で組むとスキーマ検証の手間が大きいため、対応している市販ソフトの利用をおすすめします。

CSVのカラム数が合わないとどうなりますか?

e-Taxの取り込みは厳密で、カラム(列)数が仕様書の定義と1つでも違うとエラーで弾かれます。典型的な原因は、Excelで保存する際に右端に空白列が含まれてしまう・氏名フィールドにカンマが入っているためエスケープされていない、などです。CSVをテキストエディタで開いて1行のカンマ数が全行で同じか確認するだけでも、取り込み前に多くのエラーを潰せます。

全角・半角はどちらで入力すればいいですか?

項目によって異なります。氏名・住所など日本語項目は全角、数字・英字・電話番号は半角が指定されていることが多いです。Excelでセルをコピペすると意図せず全角数字や全角スペースが混入しやすいので、本サイトの全角・半角変換ツールで一括して半角に揃えてから書き出すと事故を減らせます。最終的な可否は仕様書の項目定義を確認してください。

CSVのファイルはサーバーに送信されますか?

ぱんだツールズのCSV関連ツールは、ファイルをすべてブラウザ内で処理しサーバーには送信しません。マイナンバーや給与額などが含まれる法定調書CSVのような機密性の高いデータでも、本ツールで文字コードや改行コードの整形を行えます。実際に提出するe-Tax本体への送信は国税庁のソフト経由で行ってください。

このガイド通りに作れば必ず受理されますか?

いいえ、保証はできません。e-Taxの仕様は税制改正や運用変更にあわせて年度ごとに更新されており、本記事は一般的な詰まりポイントの整理にとどめています。実際に提出する前には、必ず国税庁公式の最新仕様書とe-Taxソフトのテスト送信機能で検証し、必要に応じて顧問税理士に確認してください。

この記事で紹介したツール