【问题标题】:Replacing parentheses using regex in Python在 Python 中使用正则表达式替换括号
【发布时间】:2019-10-25 22:36:50
【问题描述】:

我正在尝试用 1 和 2 替换数字或单个字母 (1)、(a) 周围的括号。我想保留较长的单词 (reprehenderit)

这是我尝试过的。当我只希望它出现一次时,句号出现在所有前括号的两侧。

谢谢


import re

text = '''Lorem ipsum dolor sit amet,\n\n(1)consectetur adipiscing elit, sed do eiusmod tempor incididunt\n\n(2)ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip\n\n(a) ex ea (commodo consequat). Duis aute irure dolor in (reprehenderit) in voluptate velit esse cillum dolore eu\n\n(b) fugiat nulla pariatur. Excepteur sint occaecat cupidatat non proident, sunt in culpa qui officia deserunt mollit anim id est laborum.'''

result = re.sub(r'[\(\)]','.\1', text)

Print(result)

我得到了什么:

Lorem ipsum dolor sit amet,

.1. consectetur adipiscing elit, sed do eiusmod tempor incididunt

.2. ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip

.a. ex ea .commodo consequat.. Duis aute irure dolor in .reprehenderit. in voluptate velit esse cillum dolore eu

.b. fugiat nulla pariatur. Excepteur sint occaecat cupidatat non proident, sunt in culpa qui officia deserunt mollit anim id est laborum.

我正在寻找:

Lorem ipsum dolor sit amet,

1. consectetur adipiscing elit, sed do eiusmod tempor incididunt
2. ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip
    a. ex ea (commodo consequat). Duis aute irure dolor in (reprehenderit) in voluptate velit esse cillum dolore eu
    b. fugiat nulla pariatur. Excepteur sint occaecat cupidatat non proident, sunt in culpa qui officia deserunt mollit anim id est laborum.

【问题讨论】:

  • 这些点并不是唯一的问题,因为"\1" 是一个八进制代码\001 的字符。你需要类似re.sub(r'\(([\da-z]+)\)', r'\1. ', s)
  • 当然。正则表达式可能会很痛苦。我已经尝试过了,它有效。感谢您的帮助。非常感谢。
  • 您的正则表达式中没有捕获组,您希望用什么替换 \1?您只是将所有() 替换为.
  • 您是否希望正则表达式替换在匹配字母而不是数字时自动添加额外的缩进?

标签: python regex replace


【解决方案1】:
result = re.sub(r'\(([0-9a-z])\)', r'\1. ', text)

【讨论】:

  • 它将替换文本中所有出现的,例如(1992)
  • 括号内只能是一个字母。
  • @WiktorStribiżew,不应该?
  • @Barmar,已删除 +
  • 现在,您将在字符串中的任何位置删除它们,而它们只能在行首匹配
【解决方案2】:

您实际上是在删除任何带有点的 () 以及带有八进制代码 \001 的字符。

如果您想将行首的(...) 替换为内部使用的一个字母或数字

result = re.sub(r'^\(([\da-z])\)', r'\1. ', text, flags=re.M)

this regex demo。请注意^ 的使用,它仅在行首启用匹配(它与flags=re.M 标志一起使用)。

当有 1+ 个数字时删除 字母使用

result = re.sub(r'^\((\d+|[a-z]+)\)', r'\1. ', text, flags=re.M)

请参阅regex demo。这里,

  • ^ - 匹配行首
  • \( - ( 字符
  • (\d+|[a-z]+) - 1 个或多个数字或 1 个或多个字母
  • \) - ) 字符。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2020-01-07
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多