【发布时间】:2013-12-24 17:04:05
【问题描述】:
我从here 下载了源代码。我试图运行托比·塞加兰(Toby Segaran)的“编程集体智能”一书的第 4 章中的示例。我的python版本是2.7.2。我在解释器中输入这段代码:
import searchengine
pages=['http://en.wikipedia.org/wiki/Programming_language']
crawler = searchengine.crawler('searchindex.db')
crawler.crawl(pages)
并得到消息:
Could not open http://en.wikipedia.org/wiki/Programming_language
或者有时会收到消息:
Indexing http://en.wikipedia.org/wiki/Programming_language
Could not parse page http://en.wikipedia.org/wiki/Programming_language
总的来说,爬虫不会索引页面。我做错了什么?
【问题讨论】:
标签: python search search-engine ranking