“JR四ツ谷駅は「東京都新宿区四谷1丁目無番地」”
元記事は名前の多様性がテーマなんですね。比較的シンプルな名前ですらこれだけ問題をはらんでいるのだから、ましてや住所ときたら。住所に興味を持ったらぜひ拙著「ヤバい住所」も読んでみてください。
非常に面白い。この誤謬に当てはまる事例集が欲しいなぁ。日本だけじゃなく海外も含めて。
「青ヶ島村の全域には地番がなく」青ヶ島に無いのは番地であって、法務局が管理する地番は存在するのではないかと思う。そうでなければ登記ができない。/『ヤバい住所』は技術書典で無料だった。ヤバい。
そもそも東京に住むシステムに関わる人も一般的な東京都23区の住所は『同じ場所に2つ存在している』(地番と住居表示)ってことを知らないよね。なお不動産業者ですら地番と住居表示が間違っていたりする
プログラマーにとってどうでもいい情報だった
オマージュとしてよくできてる。住所は分割を伴う相続・譲渡で無限に増えるからなー
個人の属性データに関する楠正憲さんの投稿も面白いので見ていって。 https://x.com/masanork/status/2012697847637086334
確かに馴染みの寿司屋も住所に番地が無い(そこは青ヶ島でもJR四谷駅でもない)。でも既出ブコメのように地番はあるだろう。でないと相続とかどうするんだ、って話。
クラッシュ?筆者の住所がシステムを何度をクラッシュさせてきたってどういう事?ただ事ではないな。マンション名にSQLインジェクションでも含まれているのかな?
住所表記に関する様々なパターンの事例
京都の住所見たら卒倒しそうな増田だな
新潟県新潟市北区の東栄町(ひがしさかえまち)はこれが町名で直後に番号が続く。東栄町(とうえいちょう)は東栄町一丁目〜三丁目が町名なので、実際にはそれほど混乱はないかも。自治体なわけがない
増田…?
同住所は島よりも「岐阜市鷺山1769番地2」「同5」がやばかったね。もう解消してるけど。 https://withnews.jp/article/f0190329000qq000000000000000W0bv10601qq000018901A
少し性質は違うけど、住所はどこまで省略できるかを実験した記事も面白い https://dailyportalz.jp/b/2007/01/18/b/ 最終的に数字だけで届いた
デジタル庁のアドレスベースレジストリが今まさに頑張って整理してくれているらしいので、数年後にはきっと解決するんだと信じてる
中国の場合、住所を行政区画の構造通りに書く必要がないようだ。職場の住所は通称の「区」が使われてるし、友人の身分証では地級市を飛ばして県級市が記述されてた。
むしろプログラマー以外が抱いている誤謬では
PGの仕事はこういうヘンテコな住所を含んでもシステム要件が求める(ほどほどに適切な)例外処理をすることであって、住所を正規化することでも完全無欠のバリデーションを作ることでもない。
物事を一意に特定できることの重要性はもっと知られてほしいですね。プログラマーより事務をする人が困るので
マンション名に入力が通らない文字とか含まれてたりするよね。転居したとき、市役所が回避方法の文字を教えてくれたよ。
他はともかく、郵便番号が数字以外であることなんてあるの?/アルファベットまで使う地域もあり、キリル文字を使う地域がある、と。
個人的には土地区画整理事業関連の住所表記にイラッとくる。あとで補正されることを念頭に自治体の公開サイトに変換表ファイルをアップしてもらうとかできないのかな。
住所の正規化は…伝統的に難題と知られている…
京都の通り名は公式の住所とはまた違うけどデファクトスタンダードな上に同じ地点に対しパスが複数取りうるのがヤバい
「誤謬(ごびゅう)」って単語、一旦覚えたら使いたくなるよね!サンクコスト効果じゃなくて「コンコルドの誤謬」って言うと、ああ今で言うとリニアのことね!って思うもん。
「銀座インズ」とか住所が未確定とかすごいな。どこの紛争地域だよ。https://president.jp/articles/-/79080?page=1
人間の認識によって変わる可能性がある。変な漢字を使ったり使わなかったりする。何種類かの書き方で表すことができる。問題は人間。
なんか以前に読んだ名前についての意味不明な文章に似てるけどこちらは具体例を提示してくれてるからわかりやすい
3 word プラスαでどうにかならんだろうか。あと電車の路線と駅のIDな。
郵便番号から都道府県が特定出来る、という誤解もよくある。
統一住所みたいなエイリアスを充てたくなってくるね
区画整理や市区町村合併ができるなら、住所の整理もしていいと思うんだけど、俺がそんなこと思うのも当事者じゃないからなんだろうな
併せて読みたい:ぼくたちのかんがえたさいきょうのi18n国家 #I18n - Qiita https://qiita.com/yugui/items/55f2529c5a731badeff7#地理
文字列から場所が特定できればいいんだから、特別頑張らない限りぐちゃぐちゃになるよね
KEN_ALL.csvを畏れよ
重箱の隅だけど東栄町の話の「町」は自治体じゃなくて行政区画では|違う話だが似た話に大阪メトロにだいどう豊里駅があるんだけどなぜ平仮名かというとそこの区画が大道と大桐だからというのがある
東栄町と東栄町は、もともと別の市だったのね。それが合併で新潟市のそれも同じ北区に合流しちゃったと
“青ヶ島村の全域には地番がなく、すべての住居の住所が「東京都青ヶ島村無番地」” は?????なにそれこわい
まず地番と住居表示があるところから/真面目に正規化しようとすると地獄よね…/名前も含め雑に1フィールドで扱いたいがシステム連携があると分割しないとっていう
多少の正規化はやったとして、住所なんてaddressに何でも入れられるようにしとけばええやろ。未入力だけ弾くだけで困ることない。内容が正しいかなんてものはシステムの範疇じゃない。
一つの住所に複数の建物があるのは、その番地と号を振った時は、そこは1件だったからで、東京は50坪が3つの分譲地に分割されるのが当たり前なので、どんどん同じ住所が増える。もう空いてる番号降って欲しいわ
住所に関する21の一般的誤謬と日本固有の8例を挙げ、28文字のマンション名や英数字混在の7文字部屋番号など実例で固定形式の危うさを指摘する。
市区町村当たりを積極的に分離したいと思うプログラマは少ないと思うが?
「土地に対する正式な住所は有限通りで記載できる。」これは正しいのでは?少なくとも「任意有限時間の範囲で」って但し書きで。(広義一様収束みたいなやつ)
特に要件がなければ市区町村の下はその他住所にしてるがヤマトや佐川と繋ごうと思うと細かく分けないと入らないんだよね…
21世紀も1/4が過ぎたのだからそろそろ住所ぐらい正規化・コードがしても良いのでは?
正規化できん認識はあったけど、こんなん存在するんやね。
自分たちで配送オペを組んでいたので、めちゃくちゃ悩まされたのよね。住所からGPS情報を特定しないといけなくて、できない場合はユーザーに返すんだけど、、
住所の理不尽さは郵便番号CSVとかを扱うと大体分かる。/『東京都中央区には「銀座インズ」など無数の住所のない土地が存在する』行政仕事しろ(笑)
後半に行くほどすごくなる(ノ∀`)まじか・・・一意でさえないのか
“住所は必ず番地を含む? JR四ツ谷駅は「東京都新宿区四谷1丁目無番地」 番地はなくても、丁目とか、流石に町字はあるよね...? 龍ケ崎市役所は「茨城県龍ケ崎市3710番地」”
とにかく日本の住所のヤバさをもっと知るべきだと思います 2023年6月7日 06:59 https://note.com/inuro/n/n7ec7cf15cf9c
「名前」のオマージュ。確かに読んだ記憶がある。最後まで読まずに済んだ。
うお〜
住所は本当に難しいよなあ。フォームとしては前半後半くらいで2つ作っておくくらいでいい気はする。address1 address2 なんて名前がダサいのでなんかいいのないかとは思うが
銀座の住所が曖昧な箇所があるのとか、大分県中津市も市の直下に丁目が無いとか住所あるある。
プログラマの抱いている「住所」についての誤謬
“JR四ツ谷駅は「東京都新宿区四谷1丁目無番地」”
元記事は名前の多様性がテーマなんですね。比較的シンプルな名前ですらこれだけ問題をはらんでいるのだから、ましてや住所ときたら。住所に興味を持ったらぜひ拙著「ヤバい住所」も読んでみてください。
非常に面白い。この誤謬に当てはまる事例集が欲しいなぁ。日本だけじゃなく海外も含めて。
「青ヶ島村の全域には地番がなく」青ヶ島に無いのは番地であって、法務局が管理する地番は存在するのではないかと思う。そうでなければ登記ができない。/『ヤバい住所』は技術書典で無料だった。ヤバい。
そもそも東京に住むシステムに関わる人も一般的な東京都23区の住所は『同じ場所に2つ存在している』(地番と住居表示)ってことを知らないよね。なお不動産業者ですら地番と住居表示が間違っていたりする
プログラマーにとってどうでもいい情報だった
オマージュとしてよくできてる。住所は分割を伴う相続・譲渡で無限に増えるからなー
個人の属性データに関する楠正憲さんの投稿も面白いので見ていって。 https://x.com/masanork/status/2012697847637086334
確かに馴染みの寿司屋も住所に番地が無い(そこは青ヶ島でもJR四谷駅でもない)。でも既出ブコメのように地番はあるだろう。でないと相続とかどうするんだ、って話。
クラッシュ?筆者の住所がシステムを何度をクラッシュさせてきたってどういう事?ただ事ではないな。マンション名にSQLインジェクションでも含まれているのかな?
住所表記に関する様々なパターンの事例
京都の住所見たら卒倒しそうな増田だな
新潟県新潟市北区の東栄町(ひがしさかえまち)はこれが町名で直後に番号が続く。東栄町(とうえいちょう)は東栄町一丁目〜三丁目が町名なので、実際にはそれほど混乱はないかも。自治体なわけがない
増田…?
同住所は島よりも「岐阜市鷺山1769番地2」「同5」がやばかったね。もう解消してるけど。 https://withnews.jp/article/f0190329000qq000000000000000W0bv10601qq000018901A
少し性質は違うけど、住所はどこまで省略できるかを実験した記事も面白い https://dailyportalz.jp/b/2007/01/18/b/ 最終的に数字だけで届いた
デジタル庁のアドレスベースレジストリが今まさに頑張って整理してくれているらしいので、数年後にはきっと解決するんだと信じてる
中国の場合、住所を行政区画の構造通りに書く必要がないようだ。職場の住所は通称の「区」が使われてるし、友人の身分証では地級市を飛ばして県級市が記述されてた。
むしろプログラマー以外が抱いている誤謬では
PGの仕事はこういうヘンテコな住所を含んでもシステム要件が求める(ほどほどに適切な)例外処理をすることであって、住所を正規化することでも完全無欠のバリデーションを作ることでもない。
物事を一意に特定できることの重要性はもっと知られてほしいですね。プログラマーより事務をする人が困るので
マンション名に入力が通らない文字とか含まれてたりするよね。転居したとき、市役所が回避方法の文字を教えてくれたよ。
他はともかく、郵便番号が数字以外であることなんてあるの?/アルファベットまで使う地域もあり、キリル文字を使う地域がある、と。
個人的には土地区画整理事業関連の住所表記にイラッとくる。あとで補正されることを念頭に自治体の公開サイトに変換表ファイルをアップしてもらうとかできないのかな。
住所の正規化は…伝統的に難題と知られている…
京都の通り名は公式の住所とはまた違うけどデファクトスタンダードな上に同じ地点に対しパスが複数取りうるのがヤバい
「誤謬(ごびゅう)」って単語、一旦覚えたら使いたくなるよね!サンクコスト効果じゃなくて「コンコルドの誤謬」って言うと、ああ今で言うとリニアのことね!って思うもん。
「銀座インズ」とか住所が未確定とかすごいな。どこの紛争地域だよ。https://president.jp/articles/-/79080?page=1
人間の認識によって変わる可能性がある。変な漢字を使ったり使わなかったりする。何種類かの書き方で表すことができる。問題は人間。
なんか以前に読んだ名前についての意味不明な文章に似てるけどこちらは具体例を提示してくれてるからわかりやすい
3 word プラスαでどうにかならんだろうか。あと電車の路線と駅のIDな。
郵便番号から都道府県が特定出来る、という誤解もよくある。
統一住所みたいなエイリアスを充てたくなってくるね
区画整理や市区町村合併ができるなら、住所の整理もしていいと思うんだけど、俺がそんなこと思うのも当事者じゃないからなんだろうな
併せて読みたい:ぼくたちのかんがえたさいきょうのi18n国家 #I18n - Qiita https://qiita.com/yugui/items/55f2529c5a731badeff7#地理
文字列から場所が特定できればいいんだから、特別頑張らない限りぐちゃぐちゃになるよね
KEN_ALL.csvを畏れよ
重箱の隅だけど東栄町の話の「町」は自治体じゃなくて行政区画では|違う話だが似た話に大阪メトロにだいどう豊里駅があるんだけどなぜ平仮名かというとそこの区画が大道と大桐だからというのがある
東栄町と東栄町は、もともと別の市だったのね。それが合併で新潟市のそれも同じ北区に合流しちゃったと
“青ヶ島村の全域には地番がなく、すべての住居の住所が「東京都青ヶ島村無番地」” は?????なにそれこわい
まず地番と住居表示があるところから/真面目に正規化しようとすると地獄よね…/名前も含め雑に1フィールドで扱いたいがシステム連携があると分割しないとっていう
多少の正規化はやったとして、住所なんてaddressに何でも入れられるようにしとけばええやろ。未入力だけ弾くだけで困ることない。内容が正しいかなんてものはシステムの範疇じゃない。
一つの住所に複数の建物があるのは、その番地と号を振った時は、そこは1件だったからで、東京は50坪が3つの分譲地に分割されるのが当たり前なので、どんどん同じ住所が増える。もう空いてる番号降って欲しいわ
住所に関する21の一般的誤謬と日本固有の8例を挙げ、28文字のマンション名や英数字混在の7文字部屋番号など実例で固定形式の危うさを指摘する。
市区町村当たりを積極的に分離したいと思うプログラマは少ないと思うが?
「土地に対する正式な住所は有限通りで記載できる。」これは正しいのでは?少なくとも「任意有限時間の範囲で」って但し書きで。(広義一様収束みたいなやつ)
特に要件がなければ市区町村の下はその他住所にしてるがヤマトや佐川と繋ごうと思うと細かく分けないと入らないんだよね…
21世紀も1/4が過ぎたのだからそろそろ住所ぐらい正規化・コードがしても良いのでは?
正規化できん認識はあったけど、こんなん存在するんやね。
自分たちで配送オペを組んでいたので、めちゃくちゃ悩まされたのよね。住所からGPS情報を特定しないといけなくて、できない場合はユーザーに返すんだけど、、
住所の理不尽さは郵便番号CSVとかを扱うと大体分かる。/『東京都中央区には「銀座インズ」など無数の住所のない土地が存在する』行政仕事しろ(笑)
後半に行くほどすごくなる(ノ∀`)まじか・・・一意でさえないのか
“住所は必ず番地を含む? JR四ツ谷駅は「東京都新宿区四谷1丁目無番地」 番地はなくても、丁目とか、流石に町字はあるよね...? 龍ケ崎市役所は「茨城県龍ケ崎市3710番地」”
とにかく日本の住所のヤバさをもっと知るべきだと思います 2023年6月7日 06:59 https://note.com/inuro/n/n7ec7cf15cf9c
「名前」のオマージュ。確かに読んだ記憶がある。最後まで読まずに済んだ。
うお〜
住所は本当に難しいよなあ。フォームとしては前半後半くらいで2つ作っておくくらいでいい気はする。address1 address2 なんて名前がダサいのでなんかいいのないかとは思うが
銀座の住所が曖昧な箇所があるのとか、大分県中津市も市の直下に丁目が無いとか住所あるある。