【问题标题】:Python string manipulationPython 字符串操作
【发布时间】:2010-04-13 07:50:28
【问题描述】:

我正在尝试将一个字符串拆分为一个 int 列表以供进一步处理。但不知何故,我无法删除列表元素之间的某些空格。字符串 x 的长度应该是 1000 而不是 1019。我尝试阅读 python 的文档并看到用于从字符串中去除空格的函数 strip()。但是,它仅适用于尾随和前导空格。我应该如何删除这些空格以及如何将 str 列表转换为 int 列表?我的代码如下:

import array

x = """73167176531330624919225119674426574742355349194934
96983520312774506326239578318016984801869478851843
85861560789112949495459501737958331952853208805511
12540698747158523863050715693290963295227443043557
66896648950445244523161731856403098711121722383113
62229893423380308135336276614282806444486645238749
30358907296290491560440772390713810515859307960866
70172427121883998797908792274921901699720888093776
65727333001053367881220235421809751254540594752243
52584907711670556013604839586446706324415722155397
53697817977846174064955149290862569321978468622482
83972241375657056057490261407972968652414535100474
82166370484403199890008895243450658541227588666881
16427171479924442928230863465674813919123162824586
17866458359124566529476545682848912883142607690042
24219022671055626321111109370544217506941658960408
07198403850962455444362981230987879927244284909188
84580156166097919133875499200524063689912560717606
05886116467109405077541002256983155200055935729725
71636269561882670428252483600823257530420752963450"""

y=[]  

for i in range(0,len(x)): #String is now in a string list
    if x[i]!='':
        y.append(x[i])
        print(y[i])

print(len(x))

【问题讨论】:

    标签: python string


    【解决方案1】:

    this SO question。不是完全重复,但答案就是您需要的:)

    ''.join(x.split())
    

    【讨论】:

    • 哇,这真是一个优雅的方法!谢谢!
    • @paradox 谢谢,但正如我所说,我从另一个 SO 问题中偷了它:)
    【解决方案2】:
    >>> x = """73167176531330624919225119674426574742355349194934
    ... 96983520312774506326239578318016984801869478851843
    ... 85861560789112949495459501737958331952853208805511
    ... 12540698747158523863050715693290963295227443043557
    ... 66896648950445244523161731856403098711121722383113
    ... 62229893423380308135336276614282806444486645238749
    ... 30358907296290491560440772390713810515859307960866
    ... 70172427121883998797908792274921901699720888093776
    ... 65727333001053367881220235421809751254540594752243
    ... 52584907711670556013604839586446706324415722155397
    ... 53697817977846174064955149290862569321978468622482
    ... 83972241375657056057490261407972968652414535100474
    ... 82166370484403199890008895243450658541227588666881
    ... 16427171479924442928230863465674813919123162824586
    ... 17866458359124566529476545682848912883142607690042
    ... 24219022671055626321111109370544217506941658960408
    ... 07198403850962455444362981230987879927244284909188
    ... 84580156166097919133875499200524063689912560717606
    ... 05886116467109405077541002256983155200055935729725
    ... 71636269561882670428252483600823257530420752963450"""
    >>> len(x)
    1019
    >>> x = x.replace("\n", "")
    >>> len(x)
    1000
    

    此时您可以随意处理 x,例如将其转换为 int:

    >>> x = int(x)
    

    或将其转换为整数列表,每个字符一个:

    >>> x = [int(c) for c in x]
    

    您也可以在源代码中执行此操作,这可能会更方便:

    >>> x = """731...
    ... ...450""".strip().replace("\n", "")
    # strip used if you want to include extra leading or trailing whitespace
    # for formatting
    

    【讨论】:

    • 我喜欢,这似乎比其他解决方案更能表达程序员的意图。
    【解决方案3】:

    比这一切都简单:您可以通过使用反斜杠将它们转义来从文字字符串中删除换行符:

    x = """73167176531330624919225119674426574742355349194934\
    96983520312774506326239578318016984801869478851843\
    85861560789112949495459501737958331952853208805511\
    12540698747158523863050715693290963295227443043557\
    66896648950445244523161731856403098711121722383113\
    62229893423380308135336276614282806444486645238749\
    30358907296290491560440772390713810515859307960866\
    70172427121883998797908792274921901699720888093776\
    65727333001053367881220235421809751254540594752243\
    52584907711670556013604839586446706324415722155397\
    53697817977846174064955149290862569321978468622482\
    83972241375657056057490261407972968652414535100474\
    82166370484403199890008895243450658541227588666881\
    16427171479924442928230863465674813919123162824586\
    17866458359124566529476545682848912883142607690042\
    24219022671055626321111109370544217506941658960408\
    07198403850962455444362981230987879927244284909188\
    84580156166097919133875499200524063689912560717606\
    05886116467109405077541002256983155200055935729725\
    71636269561882670428252483600823257530420752963450"""
    
    print len(x)
    

    -> 1000

    ~射线

    【讨论】:

    • 我不会说它更容易,因为您必须编辑输入字符串/变量的每一行,但这是解决问题的一种很好的替代方法。
    【解决方案4】:

    在 python 中有很多方法可以从字符串中删除空格。以下是我知道的两种方式:

    import string
    string.join(str.split(), "")
    

    或者,

    import re
    re.sub("\s+", "", str)
    

    【讨论】:

    • 我更喜欢 ''.join(str.split())。它更短:)
    • 它看起来更好,只是我更难记住。 :)
    【解决方案5】:

    也许你可以像这样重写你的字符串:

    x = ("1234" +
         "5678"
        )
    

    这将避免字符串中的换行符,您可以使用多行字符串。

    【讨论】:

      【解决方案6】:

      对于所有空格(\n 和 ' '):

      y = [int(i) for i in re.sub(r'\s', '', x)]
      

      对于您实际包含换行符而不是''的特定字符串:

      y = [int(i) for i in x if i != '\n']
      

      【讨论】:

        【解决方案7】:

        这应该产生一个 int 列表:

        x = [int(i) for i in x if i.isdigit()]
        

        【讨论】:

        • ,但它将是单个数字的列表,而不是 OP 中以空格分隔的大数字的列表。
        【解决方案8】:

        试试这个:

        import string
        
        y = [int(elt) for elt in x if elt not in string.whitespace]
        

        (感谢tgray

        【讨论】:

        • 不行,我得到一个错误:ValueError: invalid literal for int() with base 10: ' '
        • 是的,那是因为你也有返回字符。查看修改后的版本。
        • 您可能想在条件中使用string.whitespace。即import string; y = [int(i) for i in x if i not in string.whitespace]
        • @tgray,好主意!谢谢!
        【解决方案9】:

        使用 re.sub("\s", "", current_string) 删除空格。
        至于将 str 列表转换为 int 列表,只需将值拆分为列表时将 str 转换为 int 即可。我不确定您打算如何拆分;所以,我无法为精确的转换编写实际代码。

        【讨论】:

          猜你喜欢
          • 2013-07-21
          • 1970-01-01
          • 1970-01-01
          • 1970-01-01
          • 1970-01-01
          • 1970-01-01
          • 2010-10-18
          相关资源
          最近更新 更多