【发布时间】:2012-06-09 10:55:38
【问题描述】:
我打算用字符串中的url替换一些关键字,例如,
content.replace("Google","<a href="http://www.google.com">Google</a>")
但是,我只想用 url 替换关键字,前提是它还没有包含在 url 中。
内容是简单的HTML:
<p><b>This is an example!</b></p><p>I love <a href="http://www.google.com">Google</a></p><p><a href="http://www.google.com"><img src="/google.jpg" /></a></p>
主要是<a>和<img>标签。
主要问题:如何判断一个关键字是否已经包含在<a>或<img>标签中?
这是 PHP find and replace keywords with urls ONLY if not already wrapped in a url 中的一个类似问题,但答案不是一个有效的问题。
在 Python 中有更好的解决方案吗?代码示例更好。谢谢!
【问题讨论】:
-
您能否举例说明您希望在哪种文本上运行此功能?
-
@Acorn HTML 网页。示例:
<p><b>This is an example!</b></p><p>I love <a href="http://www.google.com">Google</a></p><p><a href="http://www.google.com"><img src="/google.jpg" /></a></p> -
您可以使用我在下面显示的示例创建一个与 或
标签匹配的正则表达式。
标签: python string google-app-engine utf-8