【发布时间】:2020-06-05 07:56:32
【问题描述】:
我正在使用六个fuzzywuzzy 比率比较字符串对,我需要为每对输出前三个分数。
这条线可以完成这项工作:
final2_df = final_df[['nameHiringOrganization', 'mesure', 'name', 'valeur']].groupby(['nameHiringOrganization', 'name'])['valeur'].nlargest(3)
但是,excel 输出表缺少包含比率名称的“mesure”列。这很烦人,因为我无法确定这六种比率中的哪一种最适合任何给定的货币对。
我认为在开头选择列可能有效(final_df[['columns', ...]]),但似乎没有。
有没有想过如何添加这些信息?
非常感谢!
【问题讨论】:
标签: python-3.x pandas pandas-groupby fuzzywuzzy