爬虫获取外部网站搜索结果

【问题标题】：crawler get external website search result爬虫获取外部网站搜索结果
【发布时间】：2009-12-16 06:15:38
【问题描述】：

我可以使用什么最佳实践和库来键入外部网站上的搜索文本框并收集搜索结果？
如何处理具有不同搜索框和复选框的网站并收集结果？
可以使用 Selenium 自动执行此操作吗？
我应该使用 Heritrix 还是 nutch？哪一个更好？我听说 nutch 带有插件。哪个社区的社区更大？

【问题讨论】：

标签： java selenium web-crawler nutch

【解决方案1】：

你可以使用：

Selenium API
HtmlUnit
HTML解析器

等等

【讨论】：

任何参考文章...如何从 selenium 获取结果并传递给 htmlparser。我虽然 selenium 可以自动化测试并且不能得到结果......
它的API可以。您可以打开这三种技术的页面并查看“入门”或用户手册 - 这是一个很好的参考

猜你喜欢

1970-01-01
1970-01-01
1970-01-01
2012-09-24
1970-01-01
1970-01-01
1970-01-01
2013-11-23
1970-01-01

相关资源

下载 2022-12-25
下载 2023-02-04
下载 2021-06-05

最近更新更多

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode