【发布时间】:2018-05-10 02:11:03
【问题描述】:
我正在尝试在MonsterIndia.com 上搜索零经验的工作,所以我使用cheerio 和nodejs 编写了以下代码,我观察到我可以通过像https://www.monsterindia.com/**php**-jobs.html 一样搜索php 工作但如果我想以零经验搜索 php 工作我不得不在网站上手动添加过滤器,但它没有反映在页面的 url 中,所以我该如何实现这一点,我是网络抓取的完整初学者,请帮助.
var request = require('request');
var cheerio = require('cheerio');
const context = "php";
function scraper(context){
request('http://www.monsterindia.com/'+context+"-jobs.html", function (error, response, html) {
if (!error && response.statusCode == 200) {
console.log("Request Called");
var $ = cheerio.load(html);
var jobs = [];
var json = {title : "", link:"", description:"", };
$('a.title_in').each(function(i , element){
console.log($(this).attr('title'));
})
}
if(error){
console.log(error);
}
});
}
scraper(context);
【问题讨论】:
-
我会在页面的源代码中查看是否有 RSS 提要。这比刮掉它更容易。
标签: javascript node.js web-scraping cheerio