「東京都新宿区西新宿1-2-3」「東京都新宿区西新宿1丁目2-3」「東京都新宿区西新宿1丁目2番3号」── 全部同じ住所だが、文字列としては別物。本記事では住所正規化の作法と、ジオコーディング前の前処理としての位置づけを扱います。
住所の構成要素
- 都道府県:47 種固定
- 市区町村:政令指定都市の「○○市○○区」をどう扱うか
- 町名:表記ゆれが多い箇所
- 丁目:「1丁目」「1-」「1」が混在
- 番地・号:「2番3号」「2-3」「(2-3)」
- 建物名・部屋番号:オプション
ライブラリ活用
- posuto:郵便番号 → 住所の変換
- jageocoder:日本語住所 → 緯度経度
- normalize-japanese-addresses:JS / Python 両対応の正規化
- Google Maps :商用、最も強力(有料)
ふくふくの進め方
「顧客住所のマッチが取れない」のご相談には、正規化テーブル整備(1〜2 週間)→ ジオコーディング連携 → 商圏分析への接続まで一気通貫でご支援します。
次回予告
EP.08 は会社名の名寄せ:法人番号 API を活用する。国税庁の API でほぼ完璧な名寄せが可能になる話。
この記事の感想を教えてください
あなたの 1 クリックで、本当にこの記事は更新されます。「もっと詳しく」「続編希望」が一定数集まった記事は、 ふくふくが 実際に内容を拡充したり続編記事を公開 します。 送信したリアクションはお使いのブラウザに記録され、再カウントされません。