【发布时间】:2020-05-21 08:51:26
【问题描述】:
我根据他们一起旅行的百分比对一起旅行的旅行者进行分组。这似乎与另一个问题 (Group Python list of lists into groups based on overlapping items) 类似,但条件不同。
只有在 80% 的行程中一起旅行的旅行者才被归为一组。同一个旅行者分在不同的组里也没关系。
数据:(实际数据集很大,有 >1000 次旅行和旅行者)
Traveller Trips
A [Trip_1, Trip_2, Trip_3, Trip_4, Trip_5]
B [Trip_1, Trip_2, Trip_3, Trip_4]
C [Trip_6, Trip_7]
D [Trip_8]
E [Trip_2, Trip_3, Trip_4, Trip_5]
F [Trip_2, Trip_3, Trip_4, Trip_5]
G [Trip_8]
预期输出:
TravelGroup Traveller
Group_1 A
Group_1 B
Group_2 A
Group_2 E
Group_2 F
Group_3 C
Group_4 D
Group_4 G
注意 A 和 B 在一个组中; A、E 和 F 在一个组中。 但是,B 和 C 不在一个组中,因为他们在所采取的行程中只有 75% 的匹配。
非常感谢这里的任何帮助,非常感谢!
【问题讨论】: