【发布时间】:2020-08-16 02:45:38
【问题描述】:
这是我在 StackOverflow 上的第一篇文章。如果我做错了什么或违反了网络规则,我深表歉意。
我的问题:我有一个在 python 中使用pandas 读取的 csv 文件。数据框有五列,命名为[yday, wday, time, stop, N]:
yday 是年日,从 1 到 365;wday 是星期几,从 1 到 7;time 是从 1 到 144 的数字(我把天分为在每个 10 分钟的间隔中,每天 1440 分钟/10 分钟 = 144);stop 是公共汽车站的编号 (1-4);N 是每个人的数量上车
好吧,我想为每个间隙输入一个条目,每天提供 144 行,但我有一些缺失的间隙,如您所见: CSV example
我的目标是添加新行以填补所有时间空白,例如添加(基于给定的图像):
320,6,81,1,1 <-- Exists
320,6,82,1,na <-- New
320,6,83,1,na <-- New
320,6,84,1,na <-- New
320,6,85,1,1 <-- Exists
我尝试用df.set_index['stop','yday','time'] 为我的DataFrame 编制索引,这样我就可以用从1 到144 的'time' 值重新编制它,但它不起作用。我是 Python 新手,想解决这个问题我很生气。
在此先感谢,对不起我的英语。
【问题讨论】:
-
您的重新索引有什么问题?您只需要使用缺少的
time值扩展您的索引,然后使用df.reindex应该可以工作:pandas.pydata.org/pandas-docs/stable/reference/api/…