zgen1
                                                             性能对比
           爬取方法
           性    能
         使用难度
          安装难度
       正则表达式
                 快
               困难
       简单(内置模块)
     BeautifulSoup
                 慢
               简单
               简单
             Lxml
                 快
               简单
            相对困难
 
当网页结构简单并且想要避免额外依赖(不需要安装库),使用正则表达式更为合适。当需要爬取数据量较少时,使用较慢的BeautifulSoup也可以的。当数据量大时,需要追求效益时,Lxml时最好选择。

posted on 2018-03-07 21:45  TO_ZG  阅读(3508)  评论(0编辑  收藏  举报

分类:

技术点:

相关文章:

  • 2021-08-13
  • 2021-12-24
  • 2021-12-12
  • 2021-12-12
  • 2021-12-24
  • 2021-12-24
  • 2022-01-14
  • 2022-12-23
猜你喜欢
  • 2022-12-23
  • 2021-09-28
  • 2021-10-11
  • 2021-11-11
  • 2022-01-01
  • 2021-09-27
  • 2022-12-23
相关资源
相似解决方案