【发布时间】:2020-04-15 02:13:06
【问题描述】:
我正在分析 11 个数据集,其中没有 2 个数据集具有相同的行(有些有 1800,其他有 1300,等等...)
如果数据集具有特定包的权重,我将获取权重的总和,并查看按其权重总和的顺序排列数据集。但是,我想考虑到一些数据集有更多的行。
有哪些方法可以产生好的答案,但要考虑到数据集的大小是不同的。
提前谢谢你!
【问题讨论】:
-
一切都取决于您要分配给号码的权重。一种简单的方法是 [Weight] + [Number] 如果权重几乎相同但数字显然是次要的,则将具有较大数字的集合排名更高。 [权重] * [数字](或其派生词)将赋予权重和数量相等的权重。然后你可以进入 [Weight] + x[Number] 或 x[Weight] * y[Number] - 无论哪种方式让你先发疯:-)