【发布时间】:2021-11-29 18:37:53
【问题描述】:
我们为亚马逊创建了一个网络爬虫,它使用 Google 表格中的 ImportXML 函数。 该公式在每个网页上重复多次,以抓取所有需要的数据。
最近我们注意到一种奇怪的行为 - 一些单元格会在一天工作,接下来它们会返回“导入的内容为空”错误,然后第二天它们会再次工作。
更奇怪的是,如果我们等待足够长的时间而不做任何事情,有错误的单元格可以自行修复并填充。
我们尝试创建文件的副本,结果是错误出现在与原始单元格不同的单元格中,并且在原始单元格中工作的单元格在副本文件中出现错误。
所有单元格的所有公式都是相似的,通过串联以允许不同的网页。
除了等待足够的时间让细胞自行发挥作用之外,还有什么可做的吗?
【问题讨论】:
标签: arrays google-sheets xpath import google-sheets-formula