【发布时间】:2014-11-22 17:06:48
【问题描述】:
在过去,我会使用 scrapy 创建一个爬虫,方法是写scrapy startproject some_project
最近,我克隆了一个有蜘蛛的存储库,现在当我导航到正确的位置并输入
scrapy crawl some_spider -o output.csv -t csv
我收到导入错误:
Traceback (most recent call last):
File "/usr/local/bin/scrapy", line 3, in <module>
from scrapy.cmdline import execute
File "/usr/lib/pymodules/python2.7/scrapy/__init__.py", line 58, in <module>
from scrapy.selector import Selector
File "/usr/lib/pymodules/python2.7/scrapy/selector/__init__.py", line 4, in <module>
from scrapy.selector.unified import *
File "/usr/lib/pymodules/python2.7/scrapy/selector/unified.py", line 7, in <module>
from scrapy.utils.misc import extract_regex
File "/usr/lib/pymodules/python2.7/scrapy/utils/misc.py", line 8, in <module>
from w3lib.html import replace_entities
ImportError: cannot import name replace_entities
我四处搜索并试图查看 `replace_entities' 发生了什么,但我找不到任何信息。任何有关为什么会发生这些导入错误的帮助以及有关如何解决此问题的任何想法都将不胜感激。
【问题讨论】:
-
我想我知道你克隆了哪个存储库 :)
pip freeze的输出显示了w3lib和Scrapy的哪些版本?谢谢。 -
哈哈,我们又见面了!我有 w3lib==1.5 和 Scrapy==0.24.4
标签: python html web-scraping scrapy screen-scraping