【发布时间】:2019-03-11 22:50:17
【问题描述】:
我有一份报告确定了总体数字/趋势的关键驱动因素。我想自动化该功能,以便能够根据该数字的百分比列出/识别基础记录。例如,如果南部(地区)小部件销售的净变化为 -5,000.00,但有正面和负面的影响——我想确定构成该因素的所有潜在驱动因素中至少约 90%(-4,500.00)——从大到小总共 5,000.00。
data
region OfficeLocation sales
South 1 -500
South 2 300
South 3 -1000
South 4 -2000
South 5 300
South 6 -700
South 7 -400
South 8 800
North 11 300
North 22 -400
North 33 1000
North 44 800
North 55 900
North 66 -800
对于南方,总销售额为 -3200。我想识别/列出至少占此移动 90% 的驱动程序(按降序排列) - 所以 -3200 的 90% 将是 2880。南办公室 3 和 4 的定向移动/销售 = -3000将是此请求的输出:
region OfficeLocation sales
South 3 -1000
South 4 -2000
对于 North,总销售额为 +1800。我想确定/列出构成此移动至少 90% 的驱动程序(按降序排列)-因此 1800 的至少 90% 将是 1620。南办公室 3 和 4 的定向移动/销售 = - 3000 将是此请求的输出:
区域办事处位置销售 北 33 1000 北 44 800
上面的数据集有南/北的正面和负面趋势。您能提供的任何帮助将不胜感激!
【问题讨论】:
-
销售额总和为正的
'North'组的预期输出是什么? -
^ 很重要。 3 和 4 不占总运动的 90%,只占净结果
-
没错,这份报告只是试图找出适合网络运动的关键驱动因素。我认为我的示例创建得很差。实际上,当潜在的推动者在整体净运动中所占的部分要小得多时,总数字要大得多
标签: python pandas pandas-groupby