【发布时间】:2017-11-14 23:23:42
【问题描述】:
我无法真正弄清楚网络抓取和网络抓取之间的区别。
如果我使用每个跟踪号从 FedEx 网站抓取数据,是网络抓取还是网络抓取?
请举一个很好的简短例子来说明不同之处。
谢谢。
【问题讨论】:
-
crawler vs scraper的可能重复
我无法真正弄清楚网络抓取和网络抓取之间的区别。
如果我使用每个跟踪号从 FedEx 网站抓取数据,是网络抓取还是网络抓取?
请举一个很好的简短例子来说明不同之处。
谢谢。
【问题讨论】:
简短回答:网络抓取只是使用机器人索引信息,而网络抓取又名网络数据提取是一种从网络中提取信息的自动化软件技术。
详细回答:
网络爬虫又名索引,用于使用机器人(也称为爬虫)对页面上的信息进行索引。网络爬虫基本上被谷歌、必应、雅虎等主要搜索引擎使用,换句话说谷歌、必应是主要的网络爬虫之一。 在这里,我们获得通用信息,而在抓取时,我们获得特定信息。
网页抓取又名网页数据提取,是一种使用机器人(又名刮板)自动提取信息/内容的方法。这里的信息可以用来复制到其他网站,也可以用来做数据分析。
[在此上下文中的信息是指各种内容,包括图像、文本、联系方式、价格等敏感信息]
【讨论】: