【问题标题】:Populating a data frame from the cumulative data of other data frame by date按日期从其他数据框的累积数据中填充数据框
【发布时间】:2021-07-30 13:45:01
【问题描述】:

我有一个包含患者 ID、入院日期和医院名称的数据框。我想创建第二个数据框,按日期计算患者人数。

我的数据框

data = {'Patient_admitted_id':  ['2323423', '234234234','234234234','324234234'],
        'Date': ['2021-01-01', '2021-01-01','2021-01-01', '2021-01-02'],
        'Hospital name' : ['Hospital1',"Hospital2","Hospital1", "Hospital3"]}

df = pd.DataFrame(data, columns=['Patient_admitted_id', 'Date', 'Hospital name' ])

Patient_admitted_id     Date      Hospital name
0   2323423           2021-01-01    Hospital1
1   234234234         2021-01-01    Hospital2
2   234234234         2021-01-01    Hospital1
3   324234234         2021-01-02    Hospital3
...

我正在尝试创建的数据框。

Date                 Cases        
0   2021-01-01        3             
1   2021-01-02        1             
2   2021-01-03        0             
...

【问题讨论】:

标签: python pandas date


【解决方案1】:

经过不同数量的测试。

选项 1:

   date_count = df.groupby('Date').groups

2021 年 1 月 1 日有 3 例,2021 年 1 月 2 日有 1 例 - 如您所愿。

选项 2:

cases = df.pivot_table(index = ['Date', 'Patient_admitted_id'], aggfunc ='size')

优先化和格式化

date_count = df.groupby('Date').count()

date_count

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2020-07-13
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2019-10-30
    • 2023-02-15
    • 2019-01-15
    相关资源
    最近更新 更多