【发布时间】:2010-04-20 01:11:24
【问题描述】:
基本上我想去掉大引号之间的单词文档。我是一个正则表达式新手,即使使用了 rubular,我也没有更接近答案。
感谢任何帮助。
【问题讨论】:
基本上我想去掉大引号之间的单词文档。我是一个正则表达式新手,即使使用了 rubular,我也没有更接近答案。
感谢任何帮助。
【问题讨论】:
使用 HTML 解析器并忘记正则表达式。正则表达式无法正确处理 HTML。
doc = Nokogiri::HTML(your_html)
doc.xpath("//blockquote").remove
发件人:Strip text from HTML document using Ruby
如果您环顾四周,还有更多关于如何使用 Nokogiri 和 XPath 的示例。
【讨论】:
原始示例:
/([^/【讨论】:
<blockquote>Some <b>bold text</b></blockquote> 失败。正如我所说:正则表达式 在技术上无法正确处理 HTML。
示例字符串:
你好世界
在 rubular 中键入以下正则表达式
(.+?)
或更通用的:
<.>(.+?)*?>
希望对你有帮助!
【讨论】:
<blockquote>Some <blockquote>quoted text</blockquote> within a quote.</blockquote> 失败。
htmlstring.split(/<.*?>/) 失败 <b title="HTML is > than RegEx">Don't do HTML with RegEx</b>。