【发布时间】:2015-10-07 23:39:34
【问题描述】:
我有一个要解析的 HTML 文档。我正在尝试使用cheerio 来解析HTML 文件。
<ul data-reactid=".0.1.0.0.1.1.0.0.0.0.1.0">
<li class="_1ht1 _1ht2" data-reactid=".0.1.0.0.1.1.0.0.0.0.1.0.1:$user=xyz">
.
.
.
.
<span data-reactid=".0.1.0.0.1.1.0.0.0.0.1.0.1:$user=xyz.0.0.$right.0.0.1.$left.0.1:0">
My Random Text
</span>
</li>
</ul>
我正在尝试从我的 HTML 中提取带有 data-reactid=".0.1.0.0.1.1.0.0.0.0.1.0" 的 ul 标记的第一个实例
在第一个 li 标签中,我想提取用户,在本例中为 xyz。之后我想在代码中提到的 span 类中找到文本。
通过 Cheerio 我尝试了以下方法:
var cheerio = require('cheerio'),
fs = require('fs');
fs.readFile('index.html', 'utf8', dataLoaded);
function dataLoaded(err, data) {
$ = cheerio.load(data);
console.log("Trying out " + JSON.stringify($("<ul data-reactid=\".0.1.0.0.1.1.0.0.0.0.1.0\">").data()));
}
打印Trying out {"reactid":".0.1.0.0.1.1.0.0.0.0.1.0"}
如何获取 HTML 中的值?
注意:xyz 是动态的,它会改变
【问题讨论】:
-
那么,你想要
<ul data-reactid=\".0.1.0.0.1.1.0.0.0.0.1.0\">作为输出,对吧? -
@Patel 不,我想提取我的随机文本。然而,即使是 ul 标签下的 html 内容也失败了
标签: jquery html parsing cheerio