【发布时间】:2015-07-31 22:15:35
【问题描述】:
我正在尝试处理邮政编码不易格式化的非常大的文件(超过 10,000 个观察值)。我需要将它们全部转换为前 5 位数字,这是我当前的代码:
def makezip(frame, zipcol):
i = 0
while i < len(frame):
frame[zipcol][i] = frame[zipcol][i][:5]
i += 1
return frame
frame 是数据框,而 zipcol 是包含邮政编码的列的名称。虽然这可行,但需要很长时间才能处理。有没有更快的方法?
【问题讨论】:
-
您需要避免 for 循环并使用“应用”方法。见stackoverflow.com/questions/7837722/…