一、爬行策略

        深度优先爬行策略、广度优先爬行策略、大站优先策略、反链策略、OPIC策略、Pagerank策略。


       二、网页分析算法


      (1)基于用户行为的网页分析算法: 根据用户对网页的访问行为及其评价

     

     (2)基于网络拓扑的网页分析算法: 结构关系

         网页粒度的分析算法

         网页块粒度的分析算法

         基于网站粒度的分析算法

 

     (3)基于网页内容的网页分析算法:网页的数据、文本等网页内容的特征


    三、网络爬虫实现技术

  网络爬虫实现的原理

    

       

        

相关文章:

  • 2021-12-24
  • 2021-09-25
  • 2021-10-26
  • 2021-11-28
  • 2021-07-15
  • 2021-08-09
猜你喜欢
  • 2021-08-21
  • 2021-07-26
  • 2021-12-08
  • 2021-12-12
  • 2021-09-19
相关资源
相似解决方案