使用 Node.js 进行网页抓取

【问题标题】：Web Scraping Using Node.js使用 Node.js 进行网页抓取
【发布时间】：2017-06-23 03:18:00
【问题描述】：

我观看并测试了教程和示例以帮助我了解抓取代码的工作原理，我也看过 Node.js 和 PHP 教程，但遗憾的是，这些教程都没有解释如何将此代码实际连接到 <input>tag在 html 中，因此当用户粘贴链接时，它会抓取并显示数据。就像这个人在这里解释的那样......但他实际上并没有展示如何将它与 html 联系起来......需要一个很大的帮助！

https://www.youtube.com/watch?v=Wo5eMclb-G4 跳到 1:05 看看我真正需要学习的内容。

非常感谢:)

【问题讨论】：

digitalocean.com/community/tutorials/…
好吧，酷！但我真正想知道的是......如何链接该代码......与

标签： javascript php html node.js

【解决方案1】：

方法如下：第 1 步

创建一个基于 node.js 和 express 的应用程序（网站），最好使用 EJS 基础（EJS 不是必需的，但它使一切变得更容易）。
在 index.ejs 文件上创建一个表单域并将一个输入域放置在表单域内。
然后您可以使用“req.body”获取输入值的值

第二步

基于“puppeteer”创建您的网络爬虫
将您的网络爬虫代码和输入表单代码放在同一条快速路线中。
当您使用“puppeteer”创建网络爬虫时，您会看到需要定义的 url 变量。您可以将变量值设置为“req.body”值并完成。如有任何澄清，请随时发表评论。

【讨论】：

猜你喜欢

1970-01-01
2020-11-07
2018-02-06
2011-03-13
2019-04-06
2019-06-23
2011-10-21
2018-10-24

相关资源

下载 2021-06-27
下载 2021-06-06
下载 2023-03-12

最近更新更多

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode