ふくふくHukuhuku Inc.
EP.07Prep 8分公開: 2026-05-10

住所の正規化:「1-2-3」「1丁目2-3」「1丁目2番3号」を統一する

日本の住所は表記揺れの宝庫。番地のハイフン・全角半角・「丁目」の有無まで、地味だが必須の正規化。

#住所#正規化
シェア

「東京都新宿区西新宿1-2-3」「東京都新宿区西新宿1丁目2-3」「東京都新宿区西新宿1丁目2番3号」── 全部同じ住所だが、文字列としては別物。本記事では住所正規化の作法と、ジオコーディング前の前処理としての位置づけを扱います。

住所の構成要素

  • 都道府県:47 種固定
  • 市区町村:政令指定都市の「○○市○○区」をどう扱うか
  • 町名:表記ゆれが多い箇所
  • 丁目:「1丁目」「1-」「1」が混在
  • 番地・号:「2番3号」「2-3」「(2-3)」
  • 建物名・部屋番号:オプション

ライブラリ活用

  • posuto:郵便番号 → 住所の変換
  • jageocoder:日本語住所 → 緯度経度
  • normalize-japanese-addresses:JS / Python 両対応の正規化
  • Google Maps :商用、最も強力(有料)

ふくふくの進め方

顧客住所のマッチが取れない」のご相談には、正規化テーブル整備(1〜2 週間)→ ジオコーディング連携 → 商圏分析への接続まで一気通貫でご支援します。

次回予告

EP.08 は会社名の名寄せ:法人番号 API を活用する。国税庁の API でほぼ完璧な名寄せが可能になる話。

シェア

この記事の感想を教えてください

あなたの 1 クリックで、本当にこの記事は更新されます。「もっと詳しく」「続編希望」が一定数集まった記事は、 ふくふくが 実際に内容を拡充したり続編記事を公開 します。 送信したリアクションはお使いのブラウザに記録され、再カウントされません。

シリーズの外も探す:

まずは、現状を聞かせてください。

要件が固まっていなくて大丈夫です。現状診断と方針提案までを無料でお手伝いします。

無料相談フォームへ hello [at] hukuhuku [dot] co [dot] jp