【发布时间】:2018-04-21 20:31:15
【问题描述】:
我正在尝试抓取该网站的$('a[href^="mailto:"]'):https://celsius.network/
当我转到浏览器控制台并运行它时,我会得到一个链接,所以我知道它在那里。
问题是我的请求(使用 Axios 库)在加载 javascript 之前返回 DOM。我已经设置了 User-Agent,但它看起来不起作用。
const axiosClient = () =>
axios.create({
headers: {
"User-Agent": "Mozilla/5.0 (iPhone; CPU iPhone OS 8_0 like Mac OS X) AppleWebKit/600.1.3 (KHTML, like Gecko) Version/8.0 Mobile/12A4345d Safari/600.1.4"
},
timeout: 10000
});
axiosClient()
.get("https://celsius.network")
.then(({ data }) => {
console.log("DATAAAAAAAA: ", data);
})
这是返回原始 HTML 和正文:
<body>
<div id="app"> </div>
....
而不是在所有 javascript 操作 DOM 之后完全加载的那个。
附:我是通过 firebase 函数来做这件事的,所以我认为我可以安装的东西是有限制的。
更新
const findEmail = url =>
new Promise((resolve, reject) => {
// here!
});
【问题讨论】:
-
当文档没有使用 CORS 标头时,如何获取原始 HTML 作为响应?
标签: javascript html node.js axios