【发布时间】:2017-10-19 02:35:26
【问题描述】:
我有一个大约 1 亿条日志的 csv。其中一列是地址,我正在尝试获取地址的纬度和经度。我想尝试解决方案中提到的类似方法,但给出的solution 是arcGIS,这是一个商业工具。我确实尝试过google API,它只限制了 2000 个条目。
将地址的经纬度放入大型数据集中的下一个最佳替代方法是什么。
输入:Site 列是来自巴黎市的地址
start_time,stop_time,duration,input_octets,output_octets,os,browser,device,langue,site
2016-08-27T16:15:00+05:30,2016-08-27T16:28:00+05:30,721.0,69979.0,48638.0,iOS,CFNetwork,iOS-Device,zh_CN,NULL
2016-08-27T16:16:00+05:30,2016-08-27T16:30:00+05:30,835.0,2528858.0,247541.0,iOS,Mobile Safari UIWebView,iPhone,en_GB,Berges de Seine Rive Gauche - Gros Caillou
2016-08-27T16:16:00+05:30,2016-08-27T16:47:00+05:30,1805.0,133303549.0,4304680.0,Android,Android,Samsung GT-N7100,fr_FR,Centre d'Accueil Kellermann
2016-08-27T16:17:00+05:30,,2702.0,32499482.0,7396904.0,Other,Apache-HttpClient,Other,NULL,Bibliothèque Saint Fargeau
2016-08-27T16:17:00+05:30,2016-08-27T17:07:00+05:30,2966.0,39208187.0,1856761.0,iOS,Mobile Safari UIWebView,iPad,fr_FR,NULL
2016-08-27T16:18:00+05:30,,2400.0,1505716.0,342726.0,NULL,NULL,NULL,NULL,NULL
2016-08-27T16:18:00+05:30,,302.0,3424123.0,208827.0,Android,Chrome Mobile,Samsung SGH-I337M,fr_CA,Square Jean Xxiii
2016-08-27T16:19:00+05:30,,1500.0,35035181.0,1913667.0,iOS,Mobile Safari UIWebView,iPhone,fr_FR,Parc Monceau 1 (Entrée)
2016-08-27T16:19:00+05:30,,6301.0,9227174.0,5681273.0,Mac OS X,AppleMail,Other,fr_FR,Bibliothèque Parmentier
NULL 的地址可以忽略,也可以从输出中删除。
输出应该有以下列
start_time,stop_time,duration,input_octets,output_octets,os,browser,device,langue,site, latitude, longitude
感谢所有帮助,提前感谢您!
【问题讨论】:
-
@InaS 我确实提到我使用 Google Api 并且有局限性,我发现的下一个最合适的解决方案是使用 arcgis 并且这是商业包。因此,我没有正确的方法来放置代码,如果我放置 Google API 代码,那么整个问题将朝着不同的方向发展。我已经在几天前的另一个问题中尝试过。
-
澄清一下,您主要是在寻求一种方法来获取大型数据集的纬度/经度坐标,而不是如何使用 pandas/python 操作数据。对吗?
-
@pshep 我对操纵持开放态度,也接受了 lat lon
-
我建议将 geopy 与 Open Street Map Nominatim 地理编码器一起使用:geopy.readthedocs.io/en/1.10.0/#geopy.geocoders.Nominatim
标签: python pandas latitude-longitude arcgis geopandas