【问题标题】:How to parse the img src link from <![CDATA]> by nokogiri如何解析来自 <![CDATA]> by nokogiri 的 img src 链接
【发布时间】:2017-07-15 00:18:40
【问题描述】:

有一个 XML 响应,如何解析来自 nokogiri &lt;![CDATA]&gt; 的 img src 链接

<description>
        <![CDATA[<img src="https://ebcnews.s3.amazonaws.com/images/2017/02/24/14879207313348jzJ88NZUPf.jpg" />]]>

      <![CDATA[
      <p>
      This is content
      </p>
      ]]>
</description>

我使用代码解析了 XML 响应,但它只返回 &lt;p&gt;This is content&lt;/p&gt;,有人知道如何解析 &lt;![CDATA]&gt; 图像 src 链接吗?

xml_doc = Nokogiri::HTML(response.body.force_encoding("UTF-8"))
xml_doc.xpath("//description").each do |ele|
  p ele
end

【问题讨论】:

    标签: html ruby xml rubygems


    【解决方案1】:

    为什么您希望使用HTML 解析器解析 XML 文档会产生任何结果?

    #                   ⇓⇓⇓
    xml_doc = Nokogiri::XML(response.body.force_encoding("UTF-8"))
    
    xml_doc.xpath("//description")
           .children
           .select { |e| Nokogiri::XML::CDATA === e }
           .first
           .content
    #⇒ "<img src=... />"
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2012-04-22
      • 2015-03-20
      • 1970-01-01
      • 2014-07-08
      • 1970-01-01
      相关资源
      最近更新 更多