【发布时间】:2014-01-12 22:21:23
【问题描述】:
我在 CSV 中有这样的内容:
phone name area
(444) 444-4444, (000) 000-0000 Foo cityname, ST
(555) 555-5555 Bar othercity, SN
我如何最简单地得出这个结论:
phone name area State
(444) 444-4444 Foo cityname ST
(555) 555-5555 Bar othercity SN
这是两个基本拆分 - 首先,我想从 ['phone'] 中删除第一个索引之后的所有内容,但在第二个中,我想将 ['area'] 中逗号之后的所有内容添加到['State'] - 我认为学习这两种方法会很棒。
在实际文件中,CSV 用逗号分隔,字段使用引号:它是标准 csv。我使用空白表来显示问题。
【问题讨论】:
-
这是一个棘手的解析任务,而且这 [似乎] 不是 csv。您的文件或手机中必须有标签,名称和区域值必须对齐,才能在一般情况下正确解析它。
-
如果您指出文件中的哪些条目由空格分隔,哪些由制表符分隔,我认为这个问题会更清楚,也许每个制表符使用
\t。
标签: python python-2.7 csv pandas dataframe