【问题标题】:importxml from raw xml on gist produces errorimportxml from raw xml on gist 产生错误
【发布时间】:2017-03-28 02:21:43
【问题描述】:

我在 Gist 上有一个原始 xml 文件: https://gist.githubusercontent.com/EmDubeu/196d95b561fa83a4ef360654ed919fe5/raw/9e2dde8d08a2ea4e45871bf8c55693334f8a69e1/NEIPA.xml

我将上述网址存储在我的 Google 电子表格 (Settings!E27) 的一个单元格中。

我正在尝试通过以下公式使用我的谷歌表中的 importxml: =IMPORTXML(Settings!E27, "//HOP/NAME"),但它返回“错误导入的 Xml 内容无法解析。”

我的公式适用于这个网址: http://www.beerxml.com/recipes.xml

为什么它不适用于我的 Gist 托管 xml 文件?

【问题讨论】:

    标签: xpath google-sheets xml-parsing


    【解决方案1】:

    GitHub 不适用于文件托管,Content-Type 标头设置不正确。如果您在浏览器中输入http://www.beerxml.com/recipes.xml,它会将页面呈现为XML 内容,但不会为您的https://gist.githubusercontent.com/EmDubeu/...,因为它无法将其识别为XML 页面。

    在这种情况下,人们(至少,我)通常使用像https://rawgit.com/ 这样的网站。对于您的 gist 文件,rawgit URL 是 https://rawgit.com/EmDubeu/196d95b561fa83a4ef360654ed919fe5/raw/fcb019a0db249ea90a9512f9162725547f4a43b5/NEIPA.xml

    但是当我输入这个 URL 时,我的浏览器说因为 & 这样的字符而无法解析页面。应该是HTML(XML) character encoded。您可以通过查看http://www.beerxml.com/recipes.xml 的来源来验证这一点,其中& 正确编码为&。你也应该对你的要点进行 html 编码。

    【讨论】:

    • 这正是我一直在寻找的解决方案!谢谢你。现在我可以晚上睡觉了!
    【解决方案2】:

    <?xml version="1.0" encoding="ISO-8859-1"?><RECIPES> 之间插入换行符

    【讨论】:

    • 感谢您的回复。我按照建议添加了换行符,但是错误仍然存​​在。我按照建议在 之间使用了 。
    • 我从有效的 XML 中复制了内容,并将其编辑到我的 gist xml 文件中。我得到了同样的错误。我想知道它是否与作为共享文件托管的 xml 文件有关,即使它在 gist 上设置为 Public?
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2020-11-30
    • 2021-07-28
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多