【发布时间】:2014-02-05 05:48:16
【问题描述】:
我正在寻求一些帮助,以根据以下内容在列表中创建一组项目 关联分数。为了解释它,请参阅下面的字典对象和我要生成的所需列表;
dict 对象的定义:
strScoresDict[uniqueID] = (itemElement1, itemElement2, associatedScore)
例子:
('item1', 'item2', 100)
('item1', 'item3', 40)
('item1', 'item4', 80)
('item2', 'item3', 40)
('item2', 'item4', 100)
('item3', 'item4', 20)
排序列表;
('item1', 'item2', 'item4', 'item3')
我的目标列表可以有超过 1000 个条目
关联分数是根据业务特定逻辑生成的,分数范围固定在0和100之间。
【问题讨论】:
-
您应该改进对问题的描述,您希望得到什么(示例)。
-
我不确定您对字典进行清晰排序的规则。
-
我要查找的输出需要检查关联分数的权重,并将分数最高的项目聚集在一起。如上图所示,例如 item1 和 item2 紧密关联,因此 item2 在 item1 之后,但 item2 和 item3 的关联分数比 item2 和 item4 低,因此序列需要将 item3 推出到 item4 下方。希望这有助于澄清我正在寻找的输出。
-
@ipyinwild 你需要一个传递关系才能进行排序,我不清楚你的关系是传递的。你真的想排序,而不是集群吗?为什么
item1排在第一位?你认为算法是确定性的吗? -
嗨 Giles,你说得对,我正在尝试创建集群。 item1 是第一个项目集群,然后是下一个。该算法应在评分过程中忽略已包含在集群中的项目。