【发布时间】:2011-06-26 11:05:22
【问题描述】:
我正在编写一个小脚本来学习如何解析 XHTML 网页。以下命令:
cat q?s=goog.xhtml | xpath '//span[@id="yfs_l10_goog"]'
返回:
Found 2 nodes:
-- NODE --
<span id="yfs_l10_goog">624.50</span>-- NODE --
<span id="yfs_l10_goog">624.50</span>
我该怎么做:
需要编写我的命令才能仅提取值
624.50吗?我需要做什么才能只提取一次?
我正在解析的源页面:http://finance.yahoo.com/q?s=goog
【问题讨论】:
-
这更像是一个 xpath 问题,不是吗?
-
确实如此。我想使用 xpath 让它工作
-
更新帖子标题更清晰
标签: bash xpath xml-parsing