【发布时间】:2015-09-05 17:10:19
【问题描述】:
我已经尝试了很长时间了。 我想从包含成人内容的 subreddit 中删除内容。 但是,问题在于,您必须先回答一个简单的问题,然后才能访问该页面,即您是否年满 18 岁。 我对源代码做了一些研究,发现解决方案是一个简单的 POST 请求。您需要在其中发送参数“over18=yes”。 但我的问题是,发布后我无法访问响应正文。
这是在 node.js 中使用 http 请求的代码。我什至用节点“请求”模块尝试过它,但也没有任何帮助。
希望能在这里找到可以帮助我的人。
var http = require("http");
var options = {
host: 'www.reddit.com',
port: 80,
path: '/over18?dest=http%3A%2F%2Fwww.reddit.com%2Fr%2Fnsfw&over18=yes',
method: 'POST'
};
var req = http.request(options, function(res) {
console.log('STATUS: ' + res.statusCode);
console.log('HEADERS: ' + JSON.stringify(res.headers));
res.setEncoding('utf8');
res.on('data', function (chunk) {
console.log('BODY: ' + chunk);
});
});
req.on('error', function(e) {
console.log('problem with request: ' + e.message);
});
// write data to request body
req.write('data\n');
req.write('data\n');
req.end();
这是使用节点请求模块的代码
var request = require("request");
request.post({url:'http://www.reddit.com/over18?dest=http%3A%2F%2Fwww.reddit.com%2Fr%2Fnsfw', form: {over18:'yes'}}, function(err,httpResponse,body){
console.log(body);
});
我尝试访问的 URL 是 http://www.reddit.com/r/nsfw
【问题讨论】:
标签: node.js web-scraping http-post reddit