無料で使える「住所マスターデータ」公開、表記統一や緯度経度への変換に活用可能 全国の町丁目レベル18万9540件の住所データを記録
INTERNET Watch
161Picks
コメント
選択しているユーザー
注目のコメント
住所データの扱いにくさは、日本のIT業界の闇の一つなので、一歩前進ですね。
ただ、日本郵政の郵便番号は、総務省の全国地方公共団体コードと別体系であり、今回は郵便番号に対応するもの。今後、全国地方公共団体コードにも対応してくれれば、まさに神対応。
=参考=
・日本郵政ー郵便番号
https://www.post.japanpost.jp/zipcode/
・総務省ー全国地方公共団体コード
https://www.soumu.go.jp/denshijiti/code.htmlこれはすごい。もしかしたら郵便局とか、(電柱を管理する上で精緻な住所データを持っている)NTTなどが売りたかったデータかもしれません。
住所データが重要なのは言うまでもありませんが、もう1つ悩ましいのがマンション・アパートの名寄せ問題。同じ建物でも人によって英語で書いたりカタカナで書いたり、数字がアラビア数字だったりローマ数字だったり。あと、不動産屋さんがポータルサイトに掲載するときに独立して表示されるよう、わざと微妙に情報を変える小技なんかもあったりして、とにかく大変です。
これも、ある程度はNNをつかって名寄せ作業の自動化もできなくはないのですが。下記は一例としてアットホーム・ラボの皆さんの発表。我々もお手伝いさせていただきました。
門洋一, 広方崇, 松村浩二, 汪雪テイ, 山崎俊彦, “ニューラルネットワークを利用した集合住宅の物件情報の名寄せ,” 人工知能学会全国大会 (JSAI2020), 1N5-GS-13-03, 2020.