【问题标题】:IMPORTXML function for Google Sheets fetches some elements but not othersGoogle 表格的 IMPORTXML 函数获取一些元素,但不获取其他元素
【发布时间】:2016-07-22 22:34:53
【问题描述】:

我想为某些 Quora 答案投票并查看数据。我正在尝试使用 Google 电子表格的 IMPORTXML 函数来执行此操作。要获取 Upvotes 数据,这是我正在使用的代码:

=IMPORTXML("https://www.quora.com/What-are-the-good-online-tutorials-and-books-to-learn-Android-development/answer/Pushpa-Latha-38","//span[@class='count']") 

由于某种原因,这显示#N/A(导入的内容为空)消息。当我在 Chrome 的 XPath Helper 插件上使用相同的 XPath 查询时,我确实得到了数据。在执行此操作之前,我还使用类似代码获得了此答案的总视图:

=IMPORTXML("https://www.quora.com/What-are-the-good-online-tutorials-and-books-to-learn-Android-development/answer/Pushpa-Latha-38","//div[@class='CredibilityFact']") 

这似乎工作正常。但不是第一个。那个有什么问题?

【问题讨论】:

    标签: xml xpath xml-parsing google-sheets


    【解决方案1】:

    importXML 获取页面的机器人是该网站的匿名访问者。所以它只能获取网站向匿名访问者显示的内容。通过在您未登录的浏览器中打开页面(或在浏览器的私人/隐身窗口中),您会发现没有 count 类的元素:没有显示赞成票。


    一般来说,要查看importXML 看到的内容,应该以隐身模式打开页面并查看其源代码。除了匿名访问者和登录访问者之间的区别外,许多网站还使用 JavaScript 修改页面,importXML bot 不会执行此操作。

    【讨论】:

      猜你喜欢
      • 2021-06-21
      • 2015-10-02
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2011-07-23
      • 2017-04-30
      • 2017-08-13
      相关资源
      最近更新 更多