【问题标题】:Google Docs Import XML Returning CommentGoogle Docs 导入 XML 返回评论
【发布时间】:2013-08-11 05:43:37
【问题描述】:

我正在尝试从此网页获取美国人口:Link

它在 HTML 中:

<div id="us-pop-container">
<h3>U.S. Population</h3>
<!-- population counter -->
<p>316,434,526</p>
</div>

我想要的是316,434,526,也就是人口。 (但它会改变)

这里是 xpath:

//*[@id="us-pop-container"]/p

当我将它放入 Google Docs 时,它什么也没有返回。但是,如果我说:

//*[@id="us-pop-container"]

它返回注释“人口计数器”。 如何返回人口数量?


这是我的完整电子表格:

A1

http://www.census.gov/popclock/print.php?component=counter

A2

//*[@id="us-pop-container"]

A3

=ImportXML(A1,A2)

【问题讨论】:

  • 您的问题是该数据不在 html 文件中的那个位置;它稍后由 javascript 添加。如果您使用 show source 而不是检查 DOM,您将看到 importxml 函数必须使用什么;您正在查看的&lt;p&gt; 在那个阶段是空的。好消息是您想要的数字在文件中,坏消息是它隐藏在一堆 javascript 和 JSON 中,我不认为尝试在电子表格中解析会很有趣。祝你好运! :)
  • @WillGoring 我浏览了该页面,发现它从this page 获取数据。我可以解析它。谢谢您的帮助! :)

标签: xml xpath google-sheets google-docs


【解决方案1】:

你也可以试试这个:

=REGEXEXTRACT(CONCATENATE(IMPORTDATA("http://www.census.gov/popclock/data/population.php/us")),"population:(.*)population_rate")

【讨论】:

    猜你喜欢
    • 2014-07-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2014-01-03
    • 1970-01-01
    • 2012-05-02
    • 2017-09-12
    相关资源
    最近更新 更多