サンプルデータについて

サンプルファイルのダウンロードと展開

以下のリンクから、 郵便番号検索アプリ 「ZIP-PON」 を利用して住所から郵便番号を収集したサンプルデータ(CSV形式) をダウンロードできます。

ダウンロード: sample.zip (285KB)

Windows の場合
ダウンロードした sample.zip ファイルを右クリックして、「すべて展開」を選択します。
macOS の場合
ダウンロードした sample.zip ファイルをダブルクリックします。
Linux (Ubuntu / Fedora) の場合
ダウンロードした sample.zip ファイルを右クリックして、「展開」を選択します。

いずれの場合も、新たに sample というフォルダが作成され、その中にサンプルファイル sample.csv が展開されます。

サンプルデータの詳細

sample.csv は、1 列目の住所から ZIP-PON 、ならびに ある無料の郵便番号検索サイト をそれぞれ利用して郵便番号を収集したデータです。

住所データは、「郵便局」(日本郵便株式会社)が公式サイトで公開している 「事業所の個別郵便番号(CSV形式)」(2025年1月31日 更新)に掲載されている各事業所の住所です。

郵便局が公式に公開しているデータではありますが、一部に誤字・脱字があったり、正式な「住所の郵便番号データ」 にはない 大字 の表記があったりして、比較的手入力に近い住所データです。

事業所の個別郵便番号データダウンロード (zip形式) - 郵便局

「事業所の個別郵便番号」データは、住所ではなく事業所に個別に割り当てられた郵便番号のデータです。 そのため、同データをダウンロードして sample.csv と郵便番号を照合しても一致しません。

サンプルデータの総件数は 22,435 件です。

そのうち、正しい郵便番号が取得できなかった件数検索にかかった時間は、それぞれ以下のとおりです。

無料の郵便番号検索サイト(検索時間 : 26分40秒)
検索結果 件数
“(該当なし)” 1,848 件 (8.24 %)
番号の誤り 494 件 (2.20 %)
ZIP-PON(検索時間 : 72秒)
検索結果 件数
“ --- ” (該当なし) 0 件 (0.00 %)
“ *** ” (複数該当あり) 14 件 (0.06 %)
末尾が “0000” または “00” (町域に該当なし) 185 件 (0.82 %)
番号の誤り 0 件 (0.00 %)

補足事項

  • 無料の郵便番号検索サイトの検索時間は、サーバーの負荷状況等により大きく変動する可能性があります。
  • ZIP-PON の検索時間は、機種の性能により大きく異なります。
  • データの件数が多く、すべての郵便番号の正誤は確認できないため、 取得された郵便番号が両者ともに同じだった場合は正しい郵便番号としています。
  • 検索に使用した機種は、いずれも “Apple MacBook Air M2, 2022” です。

ZIP-PON の検索結果について

“ --- ” (該当なし):
住所の都道府県名、または市区郡町村名に該当がない場合に取得されます。
“ *** ” (複数該当あり):

ひとつの “町域”(住所の市区町村名より後ろの部分)に複数の郵便番号が割り当てられているため、 入力されている住所だけでは判断できない場合に取得されます。

正しい郵便番号は、郵便局の以下のページで調べることができます。

郵便番号検索(住所で検索する)- 郵便局

末尾が “0000” または “00” の郵便番号 (町域に該当なし):

住所の市区町村までは該当しているものの町域に該当がない場合は、 末尾が “0000” または “00” の郵便番号が取得されます。

郵便局の “郵便番号簿” を利用して手作業で郵便番号を調べる際に、 その市区町村内に該当する町域がない場合に割り当てる郵便番号です。

東京都の郵便番号簿より(郵便局)
東京都の郵便番号簿より(郵便局)

実際に郵便番号簿に掲載されていない住所も存在するので、この番号が取得されても必ずしも間違いではありません。

ただし、町域名に誤字・脱字があったり、余計な文字が含まれる場合などにも、この番号が取得されるので確認が必要です。

正しい郵便番号は、郵便局の以下のページで調べることができます。

郵便番号検索(全国地図から検索する)- 郵便局

郵便番号簿PDF - 郵便局

データの確認について

Microsoft ExcelGoogle スプレッドシート などの表計算ソフトでは、“フィルター” 機能により、 上記のようなデータだけを表示させて、確認や修正を行うことができます。

表計算ソフトのフィルター機能については、ZIP-PON【お試し版】 に同梱されている 正規版の説明書 の以下のページで解説しています。

  • “ZIP-PON_説明書(Windows版).pdf” の 47 ページ以降
  • “ZIP-PON_説明書(macOS版).pdf” の 51 ページ以降
  • “ZIP-PON_説明書(Debian版).pdf” の 51 ページ以降
  • “ZIP-PON_説明書(Fedora版).pdf” の 51 ページ以降

【追記】 その他のサンプルによるテスト結果

国税庁の 「 法人番号公表サイト 」 からは、法人番号の指定を受けた法人等の基本3情報(称号または名称・住所・法人番号)の一覧をダウンロードすることができます。

2025 年 2 月末現在のダウンロードデータから、所在地の住所が記載されている法人等 558 万 6039 件分の住所データについて、 「ZIP-PON の検索エンジン」 を利用して郵便番号を収集してみました。

収集された郵便番号のうち、正しい番号が取得できなかった件数は以下のとおりです。

法人等の住所データからの検索結果(全 5,586,039 件)
検索結果 件数
“ --- ” (該当なし) 3,743 件 (0.07%)
“ *** ” (複数該当あり) 5,550 件 (0.10%)
末尾が “0000” または “00” (町域に該当なし) 81,348 件 (1.46%)

補足事項

  • 上記のデータ収集は、ZIP-PON そのものではなく、「ZIP-PON の検索エンジン」 を利用した別のプログラムにより行いました。 検索にかかった時間は参考にならないため、記載していません。
  • “ --- ”(該当なし) のデータのほとんどは、市町村合併前行政区の区割り変更前の古い住所でした。
  • データの件数が多く、すべての郵便番号の正誤は確認できないため、“番号の誤り” の件数は記載していません。