使用 Scrapy 从页面获取完整链接答案

【问题标题】：Get full link from page with Scrapy使用 Scrapy 从页面获取完整链接
【发布时间】：2015-04-15 12:05:27
【问题描述】：

我想从页面获取种子链接。使用 chrome 源浏览器，我看到链接是：

href="browse.php?search=Brooklyn+Nine-Nine&amp;page=1"

但后来我用 Scrapy 废弃了这个链接，我只得到：

href="browse.php?page=1"

此“search=Brooklyn+Nine-Nine&”部分不在链接中。

在页面的种子搜索表单中输入“布鲁克林九九”，它将显示所有搜索结果。

所以我的问题是它是 chromes 自动链接格式化功能吗？以及如何获得与 Chrome 显示的 Scrapy 的链接。我想我可以自己输入缺失的部分。例如用加号替换用于搜索的文本中的空格。或者也许有一些更优雅的解决方案......

【问题讨论】：

【解决方案1】：

没关系...我的脚本出错了。我的搜索文本是空的，所以链接也没有任何额外的文本。

【讨论】：