【发布时间】:2016-05-25 16:32:51
【问题描述】:
我有一个 csv 文件我想加载到 pandas 中,但是格式给我带来了一些问题。文件是这样的:
版本 1
,日期时间,名称,值
,26/Jan/2016 07:35:52,Name1,340rqi
,26/Jan/2016 07:00:00,Name2,1.00E+005
,26/Jan/2016 07:00:00,Name3,pulled_9
(这是一个乱七八糟的文件,但重点是第一列是空的,第一行是空的,位置 0,0 只有“版本 1”)
我正在使用以下代码将其放入我的 DF:
filename_cv = '123456789.csv'
sheet_cv = filename_cv[:-4] #trimming off the .csv part
df_cv = pandas.read_csv(filename_cv, sheet_cv,engine='python')
但输出并不理想。这是我得到的:
df_cv
输出[4]:
版本 1
0 ,26/Jan/2016 07:35:52,Name1,340rqi
1 ,26/Jan/2016 07:00:00,Name2,1.00E+005
2 ,26/Jan/2016 07:00:00,Name3,pulled_9
我认为那些前导逗号是我的问题,但有没有什么好的方法可以摆脱它们?
我知道我可以修剪行并更改索引(skiprows),但我确信那些前导逗号是我问题的根源。
我希望逗号分隔的值像正常一样进入它们自己的列。
怎么了?
【问题讨论】:
-
在
read_csv()函数中使用skiprows=1参数 -
这是真的,但列的前导逗号不会消失。这仍然会导致整行被格式化为字符串而不是单个 CSV 值。
标签: python csv pandas dataframe