【发布时间】:2015-01-07 16:48:27
【问题描述】:
这个功能似乎一般都可以工作,但在这种情况下:
XPATH://*[@id='leftTable']/table[1]/tbody/tr[23]/td[2](尽管它不适用于任何 XPATH)。
我得到了错误
Error: Imported XML content cannot be parsed.
我认为问题出在页面本身,但我看不到 Google 看到了什么(或者我可以看到什么?)任何指针将不胜感激。
【问题讨论】:
-
确定 IMPORTXML 可以导入 HTML - 这不一定是格式正确的 XML?您尝试过 IMPORTHTML 吗?并且,可以肯定的是,尝试使用 XPath 表达式 without
tbody. -
所以 IMPORTHTML 确实有效,但所有 XPATH 似乎都失败了。会不会是源网址有问题?
-
您真正要在原始源 HTML 中找到的内容还是由 Javascript 生成的内容?您是否尝试过没有
tbody的表达式?您是如何识别路径表达式的? -
是的,它肯定在里面。我也尝试了几个通用的 XPATH(获取链接,获取标题),这些也不起作用。我使用 Chrome 的调试工具确定了我正在使用的路径表达式。
标签: xml xpath google-sheets