【发布时间】:2012-07-24 23:38:15
【问题描述】:
使用 xPath 我得到这样的文本:
Sed id felis mi; Nam porta lacinia sapien vestibulum egestas; Praesent nec nisl purus,eget mollis metus。 Fusce euismod ante id Tellus tincidunt dignissim ornare magna blandit。 Nunc id risus quam。
我想把它分成两个变量:
var1 = 文本从开始到第一个点 => 如果这部分包含超过 10 个单词(以空格分隔)并包含分号';',那么它将从开始到第一个分号获取文本.
var2 = 文本的右侧部分。
我从这段代码开始,但它没有给我想要的东西(我还没有处理 10 个单词的条件):
let $left := data(tokenize($doc//div/blockquote/p/text(), '^(.*?)[;|.](.*?)$')[1])
let $right := data(tokenize($doc//div/blockquote/p/text(), '^(.*?)[;|.](.*?)$')[2])
提前致谢。
【问题讨论】:
标签: regex xpath xquery tokenize