【问题标题】:Importxml function to import data from a website into Google sheetImportxml 函数将数据从网站导入到 Google 表格中
【发布时间】:2023-01-04 13:25:56
【问题描述】:

我无法将数据从该网站导入到谷歌表格中。

我使用了以下公式:=importxml("https://finance.yahoo.com/quote/20MICRONS.NS?p=20MICRONS.NS&.tsrc=fin-srch", "//span[@class = 'Fw(600)']")

image of the element to be copied and its xml view

link image

使用上述公式后,我在 google 表格中得到结果,例如“在 URL 找不到资源”和其他问题。

【问题讨论】:

  • 不,我没有那样做

标签: google-sheets web-scraping google-sheets-formula yahoo-finance


【解决方案1】:

ImportXML 适用于基本任务,但如果您认真抓取,则不会让您走得太远:

  • 该方法仅适用于大多数基本网站(无法以这种方式抓取浏览器中呈现的 SPA,任何基本的 Web 抓取保护或连接问题都会中断流程,无法控制 HTTP 请求地理位置或重试次数)——而雅虎金融是不是一个简单的网站

  • 如果目标网站数据需要一些清理后处理,它会变得非常复杂,因为你现在是“用 excel 公式编程”,与用传统编程语言编写常规代码相比,这是一个相当痛苦的过程

  • 没有适当的启动和缓存控制,因此偶尔会触发该功能,如果 HTTP 请求失败,单元格将填充 ERR!价值观

我建议使用适当的工具(自动化框架 + 抓取引擎)并仅将 Google 表格用于基本存储目的: https://youtu.be/uBC752CWTew(用于自动化的 Pipedream + 用于抓取的 ScrapeNinja 引擎)

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2022-12-30
    • 1970-01-01
    • 1970-01-01
    • 2022-10-31
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多