【问题标题】:XPath query doesn't seem to be working in Google SheetsXPath 查询似乎在 Google 表格中不起作用
【发布时间】:2019-12-03 14:24:38
【问题描述】:
我在下面有以下id="dataDiv" 标签
我想用IMPORTXML提取它
=IMPORTXML("https://nseindia.com/live_market/dynaContent/live_watch/equities_stock_watch.htm?cat=N","//div/@id=dataDiv")
但我得到的是布尔值 False 而不是 div 本身的表。我该如何解决这个问题?
【问题讨论】:
标签:
xpath
web-scraping
google-sheets
google-sheets-formula
google-sheets-importxml
【解决方案1】:
//div/@id=dataDiv 不是有效的 xpath 定位器。
请尝试://div[@id='dataDiv']
【解决方案2】:
这不是 XPath 的问题。您尝试抓取的网站依赖于 JavaScript。 Google 表格不支持导入 JS 元素。您唯一的选择是在其他网站上找到您需要的相同数据。您可以简单地通过为给定站点禁用它来测试 JS 依赖项,并且可以刮掉它的剩余部分 - 在您的情况下,什么都没有:
源码抓取:
=ARRAY_CONSTRAIN(IMPORTDATA("https://nseindia.com/live_market/dynaContent/live_watch/equities_stock_watch.htm?cat=N"), 5000, 5)