【发布时间】:2016-03-02 05:30:42
【问题描述】:
我正在尝试用 pandas 填充 ascii 文件中时间序列数据中的缺失点。我觉得其他的都还好,但是第一行里面填的是nan,虽然原来有数据。 我的数据样本是:
"2011-08-26 00:00:00",1155179,3.232,23.7,3.281,0.386,25.27,111.5665,28.92,29.83,19.13,0,111.5,13.02,29.77,345.7
"2011-08-26 00:00:30",1155180,3.289,20.44,2.153,0.222,25.25,111.5735,28.94,29.82,19.53,0,111.5,13.02,29.79,342.4
.
.
"2011-08-26 23:59:30",1155297,12.62,28.06,3.162,1.356,24.3,111.4614,28.65,29.84,19.53,0,111.4,13.06,29.50,350.1
我使用的代码如下:
t1 = np.genfromtxt(INPUT,dtype=None,delimiter=',',usecols=[0])
start = t1[0].strip('\'"')
end = t1[-1].strip('\'"')
data=pd.read_csv(INPUT,sep=',',index_col=[0],parse_dates=[0])
index = pd.date_range(start,end,freq="30S")
df = data
sk_f = df.reindex(index)
因此,使用此代码,我想读取第一列的第一个和最后一个字符串,并将它们放入索引以填充指示为 nan 的可能缺失点。但是,问题是第一列也填写了如下结果:
2011-08-26 00:00:00,nan,nan,nan,nan,nan,nan,nan,nan,nan,nan,nan,nan,nan,nan,nan
2011-08-26 00:00:30,1155180,3.289,20.44,2.153,0.222,25.25,111.5735,28.94,29.82,19.53,0,111.5,13.02,29.79,342.4
.
.
2011-08-26 23:59:30,1155297,12.62,28.06,3.162,1.356,24.3,111.4614,28.65,29.84,19.53,0,111.4,13.06,29.50,350.1
这意味着即使原始文件中有数据,第一行却被意外填充。从第二行开始,一切都很好,填补缺失的数据似乎也很好。我试图找出它发生的原因。老实说,我还没找到原因。 任何想法或帮助将不胜感激。 谢谢, 艾萨克
【问题讨论】:
标签: python datetime pandas missing-data reindex