【发布时间】:2018-05-28 23:58:21
【问题描述】:
我想以与此 SO 问题类似的方式对 DataFrame 进行排序: Sorting entire csv by frequency of occurence in one column
但是,我遇到的一个问题是不能保证计数是唯一的,在这种情况下,行将被交错(我使用 EdChum 在上述问题中建议的方法)
给定以下数据框:
cluster_id,distance,url
1,0.15,aaa.com
1,0.25,bbb.com
2,0.05,ccc.com
2,0.10,ccc.com
7,0.1,abc.com
7,0.2,def.com
7,0.3,xyz.com
按照我的意愿:
cluster_id,distance,url
7,0.1,abc.com
7,0.2,def.com
7,0.3,xyz.com
1,0.15,aaa.com
1,0.25,bbb.com
2,0.05,ccc.com
2,0.10,ccc.com
请注意,在按“cluster_id”出现排序后,列 cluster_id 和 distance 仍然是有序的
【问题讨论】:
-
是否在任何列中排序? (哦,我看错了对不起!)
-
@JoseA。不确定我是否理解你。排序后,我希望列 cluster_id 和 distance 仍然按顺序排列,按“cluster_id”的出现排序后
-
是的,抱歉我看错了问题。