【问题标题】:IMPORTXML giving "Imported Content is Empty error"IMPORTXML 给出“导入的内容为空错误”
【发布时间】:2020-09-09 22:36:39
【问题描述】:

我正在尝试从 Internet 导入一些文本,但显然 google 表格无法处理动态网站。我使用 Chrome 浏览器的 Xpath。

这些是我正在研究的解决方案,但没有一个奏效。

=IMPORTXML("https://www.kite.com/python/docs/pandas.core.frame.DataFrame.sum","//*[@id='root']/div/div/div[3]/div/div/div/div[2]/section/div/code/text()") 

=INDEX(IMPORTXML("https://www.kite.com/python/docs/pandas.core.frame.DataFrame.sum","//*[@id='root']/div/div/div[3]/div/div/div/div[2]/section/div/code/text()"),1;1)

欢迎任何帮助。

【问题讨论】:

  • 我能问一下您要检索的值吗?
  • 我想检索有关该函数的文档。
  • 感谢您的回复。当我看到 URL 的 HTML 时,您想要的文档似乎是使用 Javascript 显示的。在这种情况下,无法使用 IMPORTXML 直接检索这些值。我认为你的问题的原因是由于这个。对此我深表歉意。
  • 这能回答你的问题吗? Importxml Imported Content Empty
  • 我搜索了所有这些,但我无法找到解决方法。不过还是谢谢

标签: google-sheets google-sheets-importxml


【解决方案1】:

您正在尝试获取文档文本,我明白了。

正如您所发现的,您不能简单地 ImportXML() 获取网站中的动态数据。相反,您需要做的是寻找如何检索数据。我的第一直觉总是检查网络监视器。我发现它正在通过 HTTP GET 调用https://alpha.kite.com/api/editor/symbol/python;pandas.core.frame.DataFrame.sum。响应是一个 JSON,其中包含我们的数据,其路径是 /report/description_text

这意味着我们需要一种解析 JSON 数据的方法,我们可以使用 Apps 脚本 ImportJSON 来完成。将该脚本添加到您的工作表(工具 > 脚本编辑器),然后:

=ImportJSON("https://alpha.kite.com/api/editor/symbol/python;pandas.core.frame.DataFrame.sum","/report/description_text","noHeaders")

这应该会给你你想要的文字。

【讨论】:

    猜你喜欢
    • 2016-03-17
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2023-01-04
    • 2023-01-02
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多