【问题标题】:Python alphanumeric sorting for list of lists [duplicate]列表列表的Python字母数字排序[重复]
【发布时间】:2023-03-20 20:40:02
【问题描述】:

我目前正在尝试对表单列表进行排序:

[["Chr1", "949699", "949700"],["Chr11", "3219", "444949"],
["Chr10", "699", "800"],["Chr2", "232342", "235345234"],
["ChrX", "4567", "45634"],["Chr1", "950000", "960000"]]

使用内置的sorted(),我得到:

[['Chr1', '949699', '949700'], ['Chr1', '950000', '960000'], ['Chr10', '699', '800'], ['Chr11' , '3219', '444949'], ['Chr2', '232342', '235345234'], ['ChrX', '4567', '45634']]]

但我希望“Chr2”出现在“Chr10”之前。我目前的解决方案涉及一些改编自页面的代码:Does Python have a built in function for string natural sort?

我目前的解决方案是这样的:

import re

def naturalSort(l): 
    convert= lambda text: int(text) if text.isdigit() else text.lower() 
    alphanum_key= lambda key: [convert(c) for c in re.split('([0-9]+)', key)] 
    if isinstance(l[0], list):
        return sorted(l, key= lambda k: [alphanum_key(x) for x in k])
    else:
        return sorted(l, key= alphanum_key)

产生正确的顺序:

[['Chr1', '949699', '949700'], ['Chr1', '950000', '960000'], ['Chr2', '232342', '235345234'], ['Chr10', '699', '800'], ['Chr11', '3219', '444949'], ['ChrX', '4567', '45634']]

有没有更好的方法来做到这一点?

【问题讨论】:

  • 这称为“自然排序”。
  • 啊.. 但我认为这可能不是一个骗局,因为他正试图自己创造它。但是这个问题可能更适合codereview.stackexchange.com
  • 我引用了自然排序页面。我特别询问对列表列表进行排序。

标签: python sorting alphanumeric


【解决方案1】:

喜欢吗:

In [1]: l = [["Chr1", "949699", "949700"],["Chr11", "3219", "444949"],["Chr10", "699", "800"],["Chr2", "232342", "235345234"],["ChrX", "4567", "45634"],["Chr1", "950000", "960000"]]

In [2]: sorted(l, key=lambda x: int(x[0].replace('Chr', '')) if x[0].replace('Chr', '').isdigit() else x[0])
Out[2]: 
[['Chr1', '949699', '949700'],
 ['Chr1', '950000', '960000'],
 ['Chr2', '232342', '235345234'],
 ['Chr10', '699', '800'],
 ['Chr11', '3219', '444949'],
 ['ChrX', '4567', '45634']]

或更优雅的变体:

sorted(l, key=lambda x: int(''.join([i for i in x[0] if i.isdigit()])) if re.findall(r'\d+$', x[0]) else x[0])

【讨论】:

  • 输入并不总是这种形式。有时它也可以只是“1”、“2”、“11”、“X”而没有“Chr”前缀。
  • sorted(l, key=lambda x: int(''.join([i for i in x[0] if i.isdigit()])) if [i for i in x[0] if i.isdigit()] else x[0])一样改变了排序
  • 更有趣的变种:import re; sorted(l, key=lambda x: int(''.join([i for i in x[0] if i.isdigit()])) if re.findall(r'\d+$', x[0]) else x[0])
【解决方案2】:

这是一个更紧凑的解决方案:

natkey = lambda e: [x or int(y) for x, y in re.findall(r'(\D+)|(\d+)', e)]
print sorted(data, key=lambda item: map(natkey, item))

【讨论】:

    猜你喜欢
    • 2021-01-25
    • 1970-01-01
    • 1970-01-01
    • 2021-07-19
    • 1970-01-01
    • 1970-01-01
    • 2018-10-12
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多