如何解析来自 <![CDATA]> by nokogiri 的 img src 链接答案

【问题标题】：How to parse the img src link from <![CDATA]> by nokogiri如何解析来自 <![CDATA]> by nokogiri 的 img src 链接
【发布时间】：2017-07-15 00:18:40
【问题描述】：

有一个 XML 响应，如何解析来自 nokogiri <![CDATA]> 的 img src 链接

<description>
        <![CDATA[<img src="https://ebcnews.s3.amazonaws.com/images/2017/02/24/14879207313348jzJ88NZUPf.jpg" />]]>

      <![CDATA[
      <p>
      This is content
      </p>
      ]]>
</description>

我使用代码解析了 XML 响应，但它只返回 <p>This is content</p>，有人知道如何解析 <![CDATA]> 图像 src 链接吗？

xml_doc = Nokogiri::HTML(response.body.force_encoding("UTF-8"))
xml_doc.xpath("//description").each do |ele|
  p ele
end

【问题讨论】：

标签： html ruby xml rubygems

【解决方案1】：

为什么您希望使用HTML 解析器解析 XML 文档会产生任何结果？

#                   ⇓⇓⇓
xml_doc = Nokogiri::XML(response.body.force_encoding("UTF-8"))

xml_doc.xpath("//description")
       .children
       .select { |e| Nokogiri::XML::CDATA === e }
       .first
       .content
#⇒ "<img src=... />"

【讨论】：