【发布时间】:2011-05-18 15:55:07
【问题描述】:
抓取和网页抓取之间有区别吗?
如果存在差异,为了收集一些网络数据以提供数据库供以后在定制搜索引擎中使用,最好的方法是什么?
【问题讨论】:
-
抓取意味着从页面中提取内容。爬行意味着跟随链接到达许多页面。爬虫必须抓取,这有两个原因:一是有用的爬虫不会无故遍历页面;他们收集信息(例如,为搜索引擎建立搜索索引的索引词)。其次,他们必须发现指向其他页面的链接。
标签: search-engine web-scraping web-crawler