【发布时间】:2020-05-08 06:46:14
【问题描述】:
TB_data_EMR = TB_data[TB_data["g_whoregion"] == "EMR"]
e_inc_num_by_EMRyear = []
for x in list_of_years:
def data_by_year(x):
TB_data_EMRyear = TB_data_EMR[TB_data_EMR["year"]==x]
return TB_data_EMRyear["e_inc_num"].sum()
e_inc_num_by_EMRyear.append(data_by_year(x))
我需要为“g_whoregion”列中的所有类别重复此代码。有没有一种创建函数来完成这项任务的好方法,而不是重新输入代码并简单地替换为不同的类别名称,如下所示:
TB_data_AFR = TB_data[TB_data["g_whoregion"] == "AFR"]
e_inc_num_by_AFRyear = []
for x in list_of_years:
def data_by_year(x):
TB_data_AFRyear = TB_data_AFR[TB_data_AFR["year"]==x]
return TB_data_AFRyear["e_inc_num"].sum()
e_inc_num_by_AFRyear.append(data_by_year(x))
理想情况下,我希望有一个数据框,其中包含“g_whoregion”中每个区域的“year”总“e_inc_num”(事件案例),如果这有意义的话,但我不知道如何来实现这一点。我的最终目标是创建一个线图,显示每个不同地区在给定年份的发病率。
【问题讨论】:
-
识别什么是相同的,什么是不同的。创建一个功能相同的东西。用差异参数化它。