【发布时间】:2026-01-14 09:50:01
【问题描述】:
好吧,我想要一种方法来使用 puppeteer 和 for 循环来获取网站上的所有链接并将它们添加到数组中,在这种情况下,我想要的链接不是 html 标签中的链接,它们是直接在源代码中的链接、javascript 文件链接等......我想要这样的东西:
array = [ ]
for(L in links){
array.push(L)
//The code should take all the links and add these links to the array
}
但是我怎样才能获得对 javascript 样式文件的所有引用以及网站源代码中的所有 URL? 我只是找到一个帖子和一个问题,教或展示它如何从标签中获取链接,而不是从源代码中获取所有链接。
假设你想获取这个页面上的所有标签例如:
查看源代码:https://www.nike.com/
如何获取所有脚本标签并返回控制台?我放了view-source:https://nike.com,因为你可以获得脚本标签,我不知道你是否可以在不显示源代码的情况下做到这一点,但我考虑过显示和获取脚本标签,因为这是我的想法,但是我做了不知道怎么弄
【问题讨论】:
-
赏金是一种利用声誉来宣传问题的方式,但请注意:您会立即失去代表,几乎没有机会找回它。
-
堆栈溢出不是代码编写服务。请先向我们展示您自己的研究,以及哪些有效以及您遇到的问题。
-
作为站点,您还指 1 个特定链接(例如
google.com)或所有子链接(例如google.com和google.com/something等)? -
@Tschallacka 我没有代码,我没有找到解释的东西,我问堆栈溢出以获得答案,我没有找到我要找的东西
-
@ulou 我想从 css javascript 文件等中获取所有链接和子链接以及链接,我希望能够获取源代码中可见的所有链接和子链接
标签: javascript html node.js puppeteer