【发布时间】:2021-12-28 23:34:46
【问题描述】:
我的数据框的缩短版本如下所示:
df_crop = pd.DataFrame({
'Name' : ['Crop1', 'Crop1', 'Crop1', 'Crop1', 'Crop2', 'Crop2', 'Crop2', 'Crop2'],
'Type' : ['Area', 'Diesel', 'Fert', 'Pest', 'Area', 'Diesel', 'Fert', 'Pest'],
'GHG': [14.9, 0.0007, 0.145, 0.1611, 2.537, 0.011, 0.1825, 0.115],
'Acid': [0.0125, 0.0005, 0.0029, 0.0044, 0.013, 0.00014, 0.0033, 0.0055],
'Terra Eutro': [0.053, 0.0002, 0.0077, 0.0001, 0.0547, 0.00019, 0.0058, 0.0002]
})
我现在需要使用产量对数据框中的所有值进行标准化,产量因作物而异,但因类型不同:
s_yield = pd.Series([0.388, 0.4129],
index=['Crop1', 'Crop2'])
我需要保留“类型”中的信息。如果我尝试使用.mul(),我会因为重复的索引而收到错误:ValueError: cannot reindex from a duplicate axis。
我唯一的另一个想法是使用.loc(),但我有很多列(16 列有要规范化的值)并且没有想到任何有效的。有什么建议吗?
【问题讨论】:
-
请发布您预期的输出数据框
标签: python pandas dataframe series