【发布时间】:2020-03-23 21:27:26
【问题描述】:
问题:
如何用socks5代理scrapy请求?
我知道我可以使用
polipo到convertSocksProxy ToHttpProxy
但是:
我想设置一个中间件或者scrapy.Request中的一些改动
import scrapy
class BaseSpider(scrapy.Spider):
"""a base class that implements major functionality for crawling application"""
start_urls = ('https://google.com')
def start_requests(self):
proxies = {
'http': 'socks5://127.0.0.1:1080',
'https': 'socks5://127.0.0.1:1080'
}
for url in self.start_urls:
yield scrapy.Request(
url=url,
callback=self.parse,
meta={'proxy': proxies} # proxy should be string not dict
)
def parse(self, response):
# do ...
pass
我应该为proxies 变量分配什么?
【问题讨论】:
标签: python python-3.x web-scraping scrapy