【发布时间】:2014-10-09 07:02:11
【问题描述】:
如果想从 html 中提取/匹配 Open Graph (og:) 标签,使用正则表达式(和 ColdFusion 9+),该怎么做?
棘手的一点是,它必须涵盖标签形成的两种可能变化,如下例所示:
<meta property="og:type" content="website" />
<meta content="website" property="og:type"/>
到目前为止,我得到的只是这个:
<cfset tags = ReMatch('(og:)(.*?)>',html_content)>
它确实匹配两个链接,但是只有第一个类型具有返回的内容位。内容是我需要的。
为了明确起见,所需的输出应该是一个包含所有 OG 标签的数组(它们可以是“类型、图像、作者、描述等)。这意味着它应该是灵活的,而不是仅仅基于 og:type 示例。
当然,如果可能的话,理想的输出应该是一个结构,第一列是标签的名称,第二列包含值(内容)。但这可以通过后处理来实现,并不像提取标签本身那么重要。
干杯, 西蒙
【问题讨论】:
标签: regex coldfusion