【发布时间】:2019-10-29 03:19:32
【问题描述】:
我正在尝试使用谷歌表中的 importxml 函数从网站上抓取 MPN(制造商零件号)以获取产品列表(大约 2000 种)。
网站: http://gun.deals/search/apachesolr_search/640832007756
说明说要使用importxml 公式。链接是A1,然后用chrome中的inspector复制xpath。结果:
=IMPORTXML(A1,"//*[@id='content']/div[3]/div[2]/div/div/div/div/div/div[2]/dl/div[2]/dd/a")
(说明还说将内容周围的双引号更改为单引号。)
运行公式时导入“内容为空”错误。我试图进行编辑,但我认为 XPath 不正确。有人说您不能按照说明从检查员那里复制粘贴。
我尝试的另一件事是=IMPORTHTML(A1, "list", 8)。这将返回 UPC 和 MPN。但它将 MPN 放在第二行。
我是新手,最近几天晚上一直在寻找解决方案。任何帮助将非常感激。
还有额外的问题。如果我们有 MPN,那么刮掉 UPC 的公式是什么? https://gun.deals/search/apachesolr_search/J941PSL9
【问题讨论】:
标签: web-scraping google-sheets google-sheets-importxml