【发布时间】:2017-09-06 18:54:39
【问题描述】:
我目前正在使用 PHP DOM 解析 HTML 文档中的一些标签。我想获取“关键字”元标记未更改的内容属性值。
例如,字符串“keyword1,keyword2,keyword2,keyword3”返回“keyword1,keyword2,keyword2,keyword3”,因此会破坏输出 XML 文档中关键字的实际数量。
我已经尝试过使用“htmlentities()”,但它没有做任何事情。
【问题讨论】:
-
需要明确的是,“keyword2,keyword2”应该是一个关键字,因此恰好是重复的关键字,例如“Johnson & Johnson”,或者实际上是两个关键字并且您正在尝试删除重复值。此外,正如您所知,大多数主要搜索引擎不再使用关键字元标记;所以,我不知道这是否会影响做你想做的事情的重要性。
-
是的。 "keyword2,keyword2" 是单个关键字。
-
你试过用explode(",",$string)吗?
-
另外,是的,我知道大多数搜索引擎不再使用它。我将它用作一些自动生成的 XML 的替代品。
-
在这种情况下我会选择正则表达式,但也许 DOMDocument: 替代实体在这里会有所帮助:php.net/manual/en/…