【发布时间】:2011-03-30 06:05:02
【问题描述】:
我想使用网络爬虫并爬取特定网站。该网站是一个学习管理系统,许多学生在这里上传他们的作业、项目演示等。我的问题是我可以使用网络爬虫并下载已上传到学习管理系统中的文件。在我下载它们之后,我想在它们上创建一个索引,以便查询这组文档。用户可以将我的应用程序用作搜索引擎。爬虫可以做到这一点吗?我知道 webater(用 Java 编写的爬虫)
【问题讨论】:
-
如果您可以手动查看作业、演示文稿等,爬虫也可以。
-
我可以将它们视为一个链接,单击该链接会被下载..
-
"我想使用网络爬虫并爬取特定网站。"什么网站?网址是什么?
标签: java web-crawler