【问题标题】:Importxml returning imported content is emptyImportxml 返回导入内容为空
【发布时间】:2020-02-10 01:58:59
【问题描述】:

我用过代码

=IMPORTXML("https://www.propertyguru.com.sg/listing/hdb-for-sale-207-bishan-street-23-21890867","//div[@class='listing-title']")

最初它可以工作,但是,它变成了导入的内容是空的。

我在想可能是网站阻止了抓取,有时当我滚动浏览它的网站时,它会要求我验证我不是机器人。

有什么想法吗?

【问题讨论】:

  • HTML中似乎没有使用带有listing-title的div标签。那我能问一下你期望的结果吗?
  • 最初您可能已经缓存了它,因为您滚动浏览了它,但我认为一旦缓存过期,正常行为就会开始:我认为页面的元素在滚动事件发生之前不会加载。我不在电脑上,所以无法确认。
  • 我希望得到class='listing-title' 的地址。它以前工作,然后停止。我请人帮忙,它在他的工作表上工作,我使用他的工作表并复制另一张工作表,它也可以工作,但第二天所有工作表都停止工作了。

标签: web-scraping google-sheets xpath google-sheets-formula


【解决方案1】:

由于首先访问了某些覆盖窗口,因此这似乎是不可能的。如果您运行“获取所有内容”命令,您可以看到这一点:

=IMPORTXML("https://www.propertyguru.com.sg/listing/hdb-for-sale-207-bishan-street-23-21890867",
 "//*")

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2016-03-17
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2020-08-17
    相关资源
    最近更新 更多