【发布时间】:2011-02-12 22:43:01
【问题描述】:
您好,我有一个文档,我正在尝试从中提取日期。但问题出在节点内,而且日期也是一些文本。 类似的东西
<div class="postHeader">
Posted on
July 20, 2009 9:22 PM PDT
</div>
从这个标签我只想要日期项目而不是发布在文本上。
类似的东西
./xhtml:div[@class= 'postHeader']
正在得到一切。准确地说,我拥有的文档基本上是这些元素的节点列表,例如,我将获得这些元素的 10 个具有不同日期值的节点,但更糟糕的是,问题有时在这些标签内,一些随机的其他标签也会像锚一样弹出我们等等。我可以写一个通用的 expath,它只会从 div 标签中获取日期吗?
【问题讨论】:
-
您使用的是哪种语言的 XPath,您是使用 XSL 进行转换还是提取数据?
-
请提供一个包含所有可能输入格式的示例。