【发布时间】:2017-09-24 17:56:52
【问题描述】:
我正在尝试使用带有cheerio 的nodejs 从网站中提取一些内容。 我要提取以下内容:
- “这是我的示例标题文本”文本。
- “这将是我的描述内容”文本。
- 图片来源。
这里是html:
<body>
<div class="detail_loop">
<img class="imfast" data-original="http://www.example.com/wp-content/uploads/2017/03/imageurl-250x150.jpg" title=""
align="left" width="250" height="150"
src="http://www.example.com/wp-content/uploads/2017/03/imageurl-250x150.jpg" style="display: block;">
<h2>
<a href="http://www.example.com/2017/04/576487/" rel="bookmark">This is my titile text</a>
</h2>
Here will be my description content.
<div class="clear"></div>
<div class="send_loop" style="display: none;">
<a href="http://www.example.com/2017/04/576487//#respond" target="_blank">
<div class="send_com">
<div class="send_bubb">
<div class="count">
0
</div>
</div>
</div>
</a>
<a href="https://www.facebook.com/sendr.php?u=http://www.example.com/2017/04/576487/" target="_blank">
<div class="send_fb">
<div class="send_bubb">
<div class="count">
send
</div>
</div>
</div>
</a>
<a href="https://twitter.com/send?url=http://www.example.com/2017/04/576487/&text=this is sample title;hashtags=example"
target="_blank">
<div class="send_tt">
<div class="send_bubb">
<div class="count">
Tweet
</div>
</div>
</div>
</a>
<div class="clear"></div>
</div>
<div class="clear"></div>
<div class="detail_loop_dvd"></div>
<div class="clear"></div>
</div>
</body>
【问题讨论】:
标签: javascript html node.js cheerio scraper