【问题标题】:Get full link from page with Scrapy使用 Scrapy 从页面获取完整链接
【发布时间】:2015-04-15 12:05:27
【问题描述】:

我想从页面获取种子链接。使用 chrome 源浏览器,我看到链接是:

href="browse.php?search=Brooklyn+Nine-Nine&page=1"

但后来我用 Scrapy 废弃了这个链接,我只得到:

href="browse.php?page=1"

此“search=Brooklyn+Nine-Nine&”部分不在链接中。

在页面的种子搜索表单中输入“布鲁克林九九”,它将显示所有搜索结果。

所以我的问题是它是 chromes 自动链接格式化功能吗?以及如何获得与 Chrome 显示的 Scrapy 的链接。 我想我可以自己输入缺失的部分。例如用加号替换用于搜索的文本中的空格。 或者也许有一些更优雅的解决方案......

【问题讨论】:

    标签: python html google-chrome hyperlink scrapy


    【解决方案1】:

    没关系...我的脚本出错了。我的搜索文本是空的,所以链接也没有任何额外的文本。

    【讨论】:

    • 如果不需要问题我建议你取消它
    猜你喜欢
    • 1970-01-01
    • 2018-12-13
    • 1970-01-01
    • 2013-05-27
    • 2012-01-07
    • 2023-03-12
    • 1970-01-01
    • 2017-10-02
    • 1970-01-01
    相关资源
    最近更新 更多