【发布时间】:2014-02-03 19:30:12
【问题描述】:
我有一些文件可以使用\r、\n 或\r\n 作为它们的换行模式。
我正在尝试将它们全部更改为\r\n,并删除连续的换行符。理论上,这很容易,任何数量的very simple regexes 都应该可以工作。
但在实践中,
text = re.sub(
reg_exp,
r'\r\n',
text)
在这个字符串上(显示行结束字符),
<ul>␍␊
␍␊
<li><a href="#">link</a></li>␍␊
␍␊
<li><a href="#">link</a></li>␍␊
<li><a href="#">link</a></li>␍␊
␍␊
<li><a href="#">link</a></li>␍␊
␍␊
</ul>␍␊
-
为
reg_exp = r'[\r\n]{2,}',制作<ul>␍ ␍␊ <li><a href="#">link</a></li>␍ ␍␊ <li><a href="#">link</a></li>␍␊ <li><a href="#">link</a></li>␍ ␍␊ <li><a href="#">link</a></li>␍ ␍␊ </ul>␍␊ -
为
reg_exp = r'[\r\n]+',制作<ul>␍ ␍␊ <li><a href="#">link</a></li>␍ ␍␊ <li><a href="#">link</a></li>␍ ␍␊ <li><a href="#">link</a></li>␍ ␍␊ <li><a href="#">link</a></li>␍ ␍␊ </ul>␍ ␍␊
我不知道为什么。
我的正则表达式是否由于某种原因与 \r 不匹配?
【问题讨论】:
标签: python regex line-endings