【发布时间】:2019-12-03 23:27:49
【问题描述】:
我正在尝试使用 Node Crawler (https://github.com/bda-research/node-crawler) 访问网页,但我需要在窗口提示中输入凭据。
当尝试使用爬虫访问页面时,我会直接发送到 401 页面(如果我取消提示,我会在 Chrome 中被定向到该页面)。
var Crawler = require("crawler");
var c = new Crawler({
callback: function (error, res, done) {
if (error) {
console.log(error);
} else {
var $ = res.$;
// $ is Cheerio by default
// a lean implementation of core jQuery designed specifically for the server
console.log($("title").text()); // logs 401
}
done();
}
});
c.queue(url);
谢谢!
【问题讨论】:
-
显示您的代码以及您尝试过的内容。您是否使用 npm 包来执行此操作?没有更多信息很难提供帮助
-
怎么样,@abney317?
-
如果您需要与页面交互,最好使用puppeteer。
标签: javascript html node.js web-crawler