【发布时间】:2020-07-16 09:00:21
【问题描述】:
我正在处理 COVID 数据,并试图控制人口并显示每 100,000 人的发病率。
我有一个带有人口的 DataFrame:
**Country** **Population**
China 1389102
Israel 830982
Iran 868912
我有第二个显示 COVID 数据的 DataFrame:
**Date** **Country** **Confirmed**
01/Jan/2020 China 8
01/Jan/2020 Israel 3
01/Jan/2020 Iran 2
02/Jan/2020 China 15
02/Jan/2020 Israel 5
02/Jan/2020 Iran 5
我希望使用来自人口数据帧的信息对我的 COVID 数据帧执行计算。也就是说,通过以下方式对每个数据的每 100,000 个案例进行归一化:
(中国数据点/中国人口)* 100,000
我的其他国家/地区也是如此。
我对此感到困惑,不太确定我是否可以通过分组数据、压缩数据等来实现我的结果。 欢迎任何帮助。
编辑:我应该补充一点,确诊病例会随着时间的推移而累积。因此,例如,我希望在 1 月 1 日为中国表演:(8/中国人口)*100000 并且同样适用于 1 月 2 日、1 月 3 日、1 月 4 日......再次,同样适用于每个国家。本质上是根据另一个 DataFrame 中的数据对整个 DataFrame 执行计算。
【问题讨论】:
-
你的预期输出是什么?
-
@MayankPorwal 确切的 COVID 数据框,我称之为“第二个数据框”,每 100,000 例中控制的确诊病例。