ところで行政区域データー(読み物)行政区域データーの2016年1月版の東京都小平市と国分寺市です。上側が小平市、下側が国分寺市です。隣り合っています。 これまでさんざん記事を書いておいて、今さら書くのもなんですが実は行政区域データーは、データーとしてはあまり信用できません。 境界線の場所が実際と異なる? という意味ではありません。数値処理の問題です。 この2つの地区を1つにまとめようとすると、 境界線付近に赤い点が残りました。実際は短い線です。その右側には、斜めの線も残っています。 なんでこうなるかというと、小平市のデーターと国分寺市のデーターが一致していないからです。小さな自治体単位ではなく、都道府県単位にデーターをまとめようとすると必ずこの問題が起きます。 国土数値情報ダウンロードサービスの関係者の名誉のために書いておきますが、そもそもデータの根本になっている国土地理院のデーターがこうなっていると考えられます。提供されたデータを勝手に書き換えることは無いはずです。 この地区の場合は、小平市側に3か所、数値処理が不正なデーターが混入しています。 経度は一致していますが、ある地点3か所の緯度が次のようになっています。わかりやすいよう10進数で表します。
これが、小平市の全域で小数点以下のものすごく小さな数値が全データーに入っているというのならまだ理解できますが、820座標のうち、3座標だけがこのようになっています。 10進数の数値で表すと上の表のようになりますが、実際のバイナリでは例えば末尾が0x0eだけ差があるといった具合です。がいずれにせよ、同一座標のはずが、末尾が異なる数値だということです。国分寺市側のデーターは何らかの丸めで統一され、小平市側の3つの数値は成り行きの演算のまま放りっぱなしと考えられます。 国土数値情報ダウンロードサービスでシェープファイルと同時梱包されているxmlは小数点以下8桁なので、xmlでもチェックできません。国土地理院は9桁です。場所によってはさらに制度の良いところもあります。 国土数値情報ダウンロードサービスで配信しているシェープファイルのデータは、梱包されているxmlから起こしたデーターではなく、別物を配信しているという意味です。というより、データーから桁数を短くしたxmlを作っておいたというのが正解と思われますが、xmlの数字とシェープファイルの数字は一致しない別物だと注意書きが欲しいものです。 例として小平市と国分寺市を紹介しましたが、実は他の地域でも数多くあります。 データー処理として不整合を起こさないためには、すべての座標の小数点以下の桁数を何桁目か決めたうえで統一した丸め処理を自分で行う必要があります。プログラムが作れる人は良いですが、そうでない人は何十万座標であっても手作業しかありません。 ついでの話ですが、小平市と国分寺市が接触する最も西側の座標ですが、国土地理院のデーターは変です。 行政区域として配信している面データーと、線データーは似たような値ではありますが、値が違います。同じように小数点以下の深い部分が異なります。25000分の1と2500では違うという意味ならわかりますが、同じスケールの面と線で値が違うので、不整合が発生したとき、原因を追いかけるのも一苦労です。 行政地区のデーターだけがこうなっているのかどうかわかりません。こうなると、他のデーターも怪しくなります。 |
|||||||||||||
Copyright© Shizuka-Toikanbetsu. |