【发布时间】:2021-10-03 16:48:15
【问题描述】:
我有一个数据框,下面给出了它的 sn-p。
data = {'ID':['A', 'A', 'A,'A', 'B', 'B', 'B', 'B', 'C', 'C'],
'Date':['03/25/2021', '03/25/2021',03/27/2021', '03/29/2021', '03/10/2021','03/11/2021','03/15/2021','03/16/2021', '03/21/2021','03/25/2021']}
df = pd.DataFrame(data)
我正在寻找应该是这样的最终结果。
说明:对于每个ID,study_date从开始日期开始,到最后一个日期结束。中间缺的日期要补上。如果原始数据框中缺少日期,则“missing_date”列的值为 1,否则为 0。研究日列是从开始天到结束天的天数,按顺序递增。
我尝试了一些东西,但我已经坚持了一段时间了。任何帮助是极大的赞赏。 谢谢。
【问题讨论】:
标签: python-3.x pandas dataframe series data-processing