【发布时间】:2019-04-03 22:06:34
【问题描述】:
假设我有以下文字:这是一个文字
如果我只想得到“这是一个文本”,那么正则表达式将是:
(?<=\<tag\>).*(?=\<\/tag\>)
现在想象一下,文本是这样的:
<tag> <Arial>This is a text<Arial></tag>
现在得到“这是一个文本”并忽略其他所有内容的正则表达式会是什么? Arial这个词可能不是固定的,而是变化的。
提前致谢。
【问题讨论】:
-
类似
(?<=>)(?!\s+<)[^<>]*(?=<),但在现实生活中,您更愿意使用 HTML/XML 解析器。 -
谢谢,但在那个表达中我需要某种方式来识别