【发布时间】:2021-05-15 07:00:52
【问题描述】:
这是我的代码。基本上我愿意做的是获取 HTML 并解析它以获取内容。
async function main() {
const browser = await puppeteer.launch({
headless: false,
executablePath: EXECUTABLE_PATH,
devtools: true,
timeout: 50000,
});
const page = await browser.newPage();
await page.goto(URL);
// await page.screenshot({ path: "screenshot.png", fullPage: true });
const rows = await page.evaluate(() => {
return [...document.querySelectorAll(".td-block-span6")];
});
console.log(rows);
}
main();
console.log 给了我这个
[
{},
{},
{},
{},
{},
{},
{ closure_uid_230013206: 25 },
{ closure_uid_230013206: 22 },
{ closure_uid_230013206: 20 },
{ closure_uid_230013206: 15 }
]
【问题讨论】:
-
我们需要更多信息。网址是什么?您要解析什么内容?
标签: javascript node.js web-scraping puppeteer