【发布时间】:2016-12-04 19:21:50
【问题描述】:
使用 pyspark 2.0.1
我有这个数据框
+-----------+----------+
| Longitude | Latitude |
+-----------+----------+
| 1 | 3 |
| 2 | 1 |
| 2 | 3 |
+-----------+----------+
我想有效地添加两个名为 City, Province 的列,对于每一行,使用列的值(经度和纬度)作为我已经编写的返回城市和省的 python 函数的输入。 所以输出应该是这样的
+-----------+----------+--------+--------
| Longitude | Latitude | City | Province
+-----------+----------+--------+--------
| 1 | 3 | London| London
| 2 | 1 | Paris | Paris
| 2 | 3 | Dubai | Dubai
+-----------+----------+--------+--------
【问题讨论】:
标签: python python-3.x pyspark