【发布时间】:2013-08-11 05:43:37
【问题描述】:
我正在尝试从此网页获取美国人口:Link
它在 HTML 中:
<div id="us-pop-container">
<h3>U.S. Population</h3>
<!-- population counter -->
<p>316,434,526</p>
</div>
我想要的是316,434,526,也就是人口。 (但它会改变)
这里是 xpath:
//*[@id="us-pop-container"]/p
当我将它放入 Google Docs 时,它什么也没有返回。但是,如果我说:
//*[@id="us-pop-container"]
它返回注释“人口计数器”。 如何返回人口数量?
这是我的完整电子表格:
A1:
http://www.census.gov/popclock/print.php?component=counter
A2:
//*[@id="us-pop-container"]
A3:
=ImportXML(A1,A2)
【问题讨论】:
-
您的问题是该数据不在 html 文件中的那个位置;它稍后由 javascript 添加。如果您使用 show source 而不是检查 DOM,您将看到 importxml 函数必须使用什么;您正在查看的
<p>在那个阶段是空的。好消息是您想要的数字在文件中,坏消息是它隐藏在一堆 javascript 和 JSON 中,我不认为尝试在电子表格中解析会很有趣。祝你好运! :) -
@WillGoring 我浏览了该页面,发现它从this page 获取数据。我可以解析它。谢谢您的帮助! :)
标签: xml xpath google-sheets google-docs