【问题标题】:How to iterate through pandas data frame based off two list conditions如何根据两个列表条件遍历熊猫数据框
【发布时间】:2021-05-11 15:24:03
【问题描述】:

我创建了两个独特的列表,一个包含所有产品,一个包含所有地理位置。我想要做的是根据两个列表中的值遍历数据框。我想对每个地理区域内的产品进行计算。当产品在特定地理位置销售时,我将如何设置代码以迭代它将执行计算然后移动到下一个?我目前拥有的是下面的代码,但它只创建一个包含一行的数据框。

# pseudo code:

# create unique lists:
DC_list = data4['Geography'].drop_duplicates().tolist()
Product_List = data4['Product'].drop_duplicates().tolist()


# create for loop and zip lists:
for p, g in zip(Product_List, DC_list):
    df_DC_product = (data4.loc[(data4["Geography"]==g) & (data4["Product"]==p)]).copy()
    # perform calculation

【问题讨论】:

  • 我注意到您从未接受过答案,请您在满意后考虑接受答案。如果问题仍然悬而未决,其他用户将在可能不再需要帮助时使用他们宝贵的时间来提供帮助。

标签: python pandas loops


【解决方案1】:

问题是副本在每次迭代中都会被覆盖,你最好像这样追加:

# pseudo code:

# create unique lists:
DC_list = data4['Geography'].drop_duplicates().tolist()
Product_List = data4['Product'].drop_duplicates().tolist()

df_DC_product=pd.DataFrame(columns=data4.columns)
# create for loop and zip lists:
for p, g in zip(Product_List, DC_list):
    df_DC_product = (data4.loc[(data4["Geography"]==g) & (data4["Product"]==p)]).append(df_DC_product)
    # perform calculation

请注意,我在循环之前初始化了数据帧 df_DC_product,然后用追加替换了副本

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2017-01-15
    • 2017-06-08
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2021-11-09
    • 2019-05-09
    相关资源
    最近更新 更多