【发布时间】:2015-04-15 12:05:27
【问题描述】:
我想从页面获取种子链接。使用 chrome 源浏览器,我看到链接是:
href="browse.php?search=Brooklyn+Nine-Nine&page=1"
但后来我用 Scrapy 废弃了这个链接,我只得到:
href="browse.php?page=1"
此“search=Brooklyn+Nine-Nine&”部分不在链接中。
在页面的种子搜索表单中输入“布鲁克林九九”,它将显示所有搜索结果。
所以我的问题是它是 chromes 自动链接格式化功能吗?以及如何获得与 Chrome 显示的 Scrapy 的链接。 我想我可以自己输入缺失的部分。例如用加号替换用于搜索的文本中的空格。 或者也许有一些更优雅的解决方案......
【问题讨论】:
标签: python html google-chrome hyperlink scrapy