【发布时间】:2014-01-01 23:16:10
【问题描述】:
我想出了一个面试问题,想知道你对此的看法。问题是在设计网络爬虫时:
1) DFS 与 BFS 相比,您会访问哪种类型的页面?
2) 如何避免陷入无限循环?
如果有人能回答他们,我很感激。
【问题讨论】:
-
我认为这篇文章很好地回答了这些问题:stackoverflow.com/questions/4356524/web-cralwer-algorithm-depth
-
但我的问题是,对于哪种页面,我们更喜欢 DFS 而不是 BFS。对吧?
标签: web-crawler webpage depth-first-search