【发布时间】:2020-03-11 17:10:19
【问题描述】:
我在一个无序列表中有一组颜色。它包含各种空格和换行符:
<li>blue</li><li>red</li>
<li>yellow</li>
<li>green </li><li>orange</li>
<li>purple</li><li>brown</li><li>black</li>
使用str.replace('<.+?>', ' '),我得到:
blue red
yellow
green orange
purple brown black
是否可以在不通过第二个正则表达式运行的情况下在原始正则表达式中合并空格删除(a la '\s+')?
我想要这样的数据:
blue red yellow green orange purple brown black
我知道用正则表达式修改HTML的注意事项,但这将是一个孤立的字符串发送到另一个应用程序。
【问题讨论】:
-
用单个空格字符
' '替换<.+?>|\s+怎么样? -
@dvo 这仍然在单词之间留下多个空格。每个标签都会创建一个可能导致重复空格的空格。
⁃blue⁃⁃red⁃⁃⁃yellow⁃⁃⁃green⁃⁃⁃orange⁃⁃⁃purple⁃⁃brown⁃⁃black⁃
标签: html regex tags whitespace removing-whitespace