【发布时间】:2019-02-16 22:51:49
【问题描述】:
我有一个美国邮政编码列表,我必须计算所有邮政编码点之间的距离。它是一个 6k 长的 ZIP 列表,每个实体都有 ZIP、城市、州、纬度、经度、面积和人口。
所以,我必须计算所有点之间的距离,即; 6000C2组合。
这是我的数据示例
我已经在 SAS 中尝试过,但它太慢且效率低下,因此我正在寻找一种使用 Python 或 R 的方法。
任何线索将不胜感激。
【问题讨论】:
-
可能是this可以帮助你
-
一个选项,也许不是最好的,是使用Haversine公式和一对邮政编码的纬度/经度坐标。
-
@TimBiegeleisen 在参考了几篇文章后,我认为Haversine 公式不会真正准确
-
This 可能对 R 有所帮助。最重要的是包
imap中的函数 gdist。更一般地说,有许多 GIS packages in R,无疑在计算速度、准确性和易用性方面各有利弊。 -
为了更准确,您可以使用 Vincenty 算法,该算法基于地球的椭球模型。
标签: python r pandas sas distance