【问题标题】:importXML Parse ErrorimportXML 解析错误
【发布时间】:2013-12-24 19:58:16
【问题描述】:
我需要解析 otcmarkets.com 上一组给定股票的资产负债表数据。我正在尝试在 Google 电子表格中使用 importXML 函数,但它没有为我返回任何数据。 xPath 查询未返回任何数据。这是我正在使用的功能:
=importxml("http://www.otcmarkets.com/stock/AAEH/financials","//*[@id=’totalCurrentLiabilities’]")
让我知道我做错了什么以及是否有更好的方法来解析特定的资产负债表数据。
【问题讨论】:
标签:
parsing
xpath
web-scraping
google-sheets
stock
【解决方案1】:
页面内容是使用 JavaScript 加载的,它不会在 Google 电子表格中执行。您无法使用 =importxml(...) 解析此页面。
现在该怎么办?
- 询问供应商是否提供 API。很可能他们无论如何都不想被刮掉。
- 分析页面逻辑并找到加载数据的 JavaScript 调用,然后自行获取。很可能是 JSON 格式,在没有外部库的情况下,在 Google 电子表格中不容易解析。
- 使用某些环境来查询将执行 JavaScript 调用的数据,例如 Selenium。将导致比使用 Google 电子表格更多的编程。
【解决方案2】:
尝试使用 importdata 功能:
=IMPORTDATA("http://www.otcmarkets.com/otciq/ajax/EdgarFinancialsController.json?ticker=AAEH&mode=annual")