【发布时间】:2013-05-31 21:33:14
【问题描述】:
注意:我没有用正则表达式解析很多或 html 或通用 html。我知道那很糟糕
TL;DR:
我有类似的字符串
A sentence with an exclamation\! Next is a \* character
原始标记中有“转义”字符的地方。我希望用他们的“原件”替换它们。并得到:
A sentence with an exclamation! Next is a * character
我需要从一些 wiki 标记中提取少量数据。
我在这里只处理段落/sn-ps,所以我不需要一个强大的解决方案。在python中,我尝试了一个测试:
s = "test \\* \\! test * !! **"
r = re.compile("""\\.""") # Slash followed by anything
r.sub("-", s)
这应该是:
test - - test * !! **
但它什么也没做。我在这里遗漏了什么吗?
此外,我不确定如何将任何给定的转义字符替换为其原始字符,因此我可能只会使用特定的正则表达式创建一个列表和子项,例如:
\\\*
和
\\!
可能有一种更简洁的方法可以做到这一点,因此非常感谢任何帮助。
【问题讨论】:
标签: python regex parsing markup