如何根据两个列表条件遍历熊猫数据框答案

【问题标题】：How to iterate through pandas data frame based off two list conditions如何根据两个列表条件遍历熊猫数据框
【发布时间】：2021-05-11 15:24:03
【问题描述】：

我创建了两个独特的列表，一个包含所有产品，一个包含所有地理位置。我想要做的是根据两个列表中的值遍历数据框。我想对每个地理区域内的产品进行计算。当产品在特定地理位置销售时，我将如何设置代码以迭代它将执行计算然后移动到下一个？我目前拥有的是下面的代码，但它只创建一个包含一行的数据框。

# pseudo code:

# create unique lists:
DC_list = data4['Geography'].drop_duplicates().tolist()
Product_List = data4['Product'].drop_duplicates().tolist()


# create for loop and zip lists:
for p, g in zip(Product_List, DC_list):
    df_DC_product = (data4.loc[(data4["Geography"]==g) & (data4["Product"]==p)]).copy()
    # perform calculation

【问题讨论】：

我注意到您从未接受过答案，请您在满意后考虑接受答案。如果问题仍然悬而未决，其他用户将在可能不再需要帮助时使用他们宝贵的时间来提供帮助。

标签： python pandas loops

【解决方案1】：

问题是副本在每次迭代中都会被覆盖，你最好像这样追加：

# pseudo code:

# create unique lists:
DC_list = data4['Geography'].drop_duplicates().tolist()
Product_List = data4['Product'].drop_duplicates().tolist()

df_DC_product=pd.DataFrame(columns=data4.columns)
# create for loop and zip lists:
for p, g in zip(Product_List, DC_list):
    df_DC_product = (data4.loc[(data4["Geography"]==g) & (data4["Product"]==p)]).append(df_DC_product)
    # perform calculation

请注意，我在循环之前初始化了数据帧 df_DC_product，然后用追加替换了副本

【讨论】：