【问题标题】:Natural sorting自然排序
【发布时间】:2012-06-22 04:36:01
【问题描述】:

我有一些文件需要按名称排序,不幸的是我不能使用常规排序,因为我也想对字符串中的数字进行排序,所以我做了一些研究,发现我在寻找什么被称为natural sorting

我尝试了here 给出的解决方案,效果很好。

但是,对于像 PresserInc-1_10.jpgPresserInc-1_11.jpg 这样的字符串会导致特定的自然键算法失败,因为它只匹配第一个整数,在这种情况下是 11,所以它会抛出关闭排序。所以我认为可能有帮助的是匹配字符串中的所有数字并将它们组合在一起,所以如果我有PresserInc-1_11.jpg,算法应该给我111,所以我的问题是,这可能吗?

这是文件名列表:

files = ['PresserInc-1.jpg', 'PresserInc-1_10.jpg', 'PresserInc-1_11.jpg', 'PresserInc-10.jpg', 'PresserInc-2.jpg', 'PresserInc-3.jpg', 'PresserInc-4.jpg', 'PresserInc-5.jpg', 'PresserInc-6.jpg', 'PresserInc-11.jpg']

【问题讨论】:

  • 我不明白你的问题...请发布更清晰的输入和预期输出

标签: python regex sorting natural-sort


【解决方案1】:

Google: Python natural sorting.

Result 1: 你链接的页面。

但不要止步于此!

Result 2:Jeff Atwood 的博客解释了如何正确地做到这一点。

Result 3:我根据 Jeff Atwood 的博客发布的答案。

这是该答案的代码:

import re

def natural_sort(l): 
    convert = lambda text: int(text) if text.isdigit() else text.lower() 
    alphanum_key = lambda key: [convert(c) for c in re.split('([0-9]+)', key)] 
    return sorted(l, key=alphanum_key)

您的数据结果:

PresserInc-1.jpg PresserInc-1_10.jpg PresserInc-1_11.jpg PresserInc-2.jpg PresserInc-3.jpg ETC...

在线查看:ideone

【讨论】:

  • 请在key=alphanum_key 中没有空格
  • 谢谢,你说得对,不应该止步于此 :),虽然有点累.. 谢谢 :)
【解决方案2】:

如果您不介意第三方库,可以使用natsort 来实现此目的。

>>> import natsort
>>> files = ['PresserInc-1.jpg', 'PresserInc-1_10.jpg', 'PresserInc-1_11.jpg', 'PresserInc-10.jpg', 'PresserInc-2.jpg', 'PresserInc-3.jpg', 'PresserInc-4.jpg', 'PresserInc-5.jpg', 'PresserInc-6.jpg', 'PresserInc-11.jpg']
>>> natsort.natsorted(files)
['PresserInc-1.jpg',
 'PresserInc-1_10.jpg',
 'PresserInc-1_11.jpg',
 'PresserInc-2.jpg',
 'PresserInc-3.jpg',
 'PresserInc-4.jpg',
 'PresserInc-5.jpg',
 'PresserInc-6.jpg',
 'PresserInc-10.jpg',
 'PresserInc-11.jpg']

【讨论】: