【发布时间】:2018-08-23 03:01:33
【问题描述】:
我的逗号分隔的txt文件包含如下格式的数据(当然列和行更多)。
1977,PA,2017-08-07,55,New Firms,327.0
1978,NY,2017-08-07,45,New Firms,$30,127
1978,NY,2017-08-07,$10,000,New Firms,1,000
如您所见,一些数据包含千位分隔符,我这样读:
df=pd.read_csv("data.txt", thousands=r',')
df.head()
这会给出一条错误消息
ParserError: Error tokenizing data. C error: Expected 13 fields in line 102996, saw 14
我认为发生错误是因为某些数据包含数千个分隔符。
有什么建议吗?
【问题讨论】:
-
一个快速的解决方法是使用
.split(", ")。 -
你能详细说明你的建议吗?