【发布时间】:2017-02-26 17:34:30
【问题描述】:
我正在尝试使用 nightmarejs(使用电子作为浏览器的 phantomjs 衍生工具)从 Instagram 个人资料页面中抓取一些信息。
目标是获取配置文件上所有图像的 alt 标签(例如,我只关注“显示更多”按钮之前的图像)
var Nightmare = require('nightmare');
var nightmare = Nightmare({ show: true });
nightmare
.goto('https://www.instagram.com/ackerfestival/')
.evaluate(function () {
let array = [...document.querySelectorAll('._icyx7')];
return array.length;
})
.end()
.then(function (result) {
console.log(result);
})
.catch(function (error) {
console.error('Search failed:', error);
});
这个例子有效,数组的长度为 12。电子浏览器打开和关闭,所以一切都很好。但是,如果我将返回更改为仅数组,电子浏览器将永远不会关闭,并且我不会得到 console.log。
我做错了什么?我想从数组或对象中的图像中获取所有信息。
【问题讨论】:
标签: javascript node.js web-scraping nightmare