【发布时间】:2017-01-04 13:02:24
【问题描述】:
需要帮助。 我有 Pandas DataFrame 之类的:
Shown ID Bought ID
59,60,61,62,60,63,64,65,66,61,67,68,67 67,60,63
63,64,63,64,63,65,66 0
87,63,84,63,86 86
我需要在整个“显示 ID”列中找到每个“显示 ID”行的每个数字的出现次数。
所以“显示 ID”列的预期结果是:
[[('59', 1), ('60', 2), ('61', 2), ('62', 1), ('63', 6),
('64', 3), ('65', 2), ('66', 2), ('67', 2), ('68', 1)],
[('63', 6), ('64', 3), ('65', 2), ('66', 2)],
[('87', 1), ('63', 6), ('84', 1), ('86', 1)]]
怎么做?
然后我需要创建一个列表列表,其中包含“显示 ID”列的每一行的排序值(上面列表的每个结果列表列表)。
所以总结结果一定是:
[['63', '64', '60', '61', '65', '66', '67', '68', '59', '62'],
['63', '64', '65', '66'],
['63', '87', '84', '86']]
我该怎么做? 如果数字出现频率相同,则需要在列表中按升序排序(在行中出现的越早,优先级越高)
【问题讨论】:
-
我的答案是你要找的吗?
标签: python python-2.7 sorting dataframe find-occurrences