【发布时间】:2021-01-27 14:48:04
【问题描述】:
我正在使用 scraperAPI.com 来处理我正在从事的抓取工作的 IP 轮换,我正在尝试实现他们的新发布请求方法,但我一直收到一个“HtmlResponse”对象没有属性“dont_filter” ' 错误。这是自定义的 start_requests 函数:
def start_requests(self):
S_API_KEY = {'key':'eifgvaiejfvbailefvbaiefvbialefgilabfva5465461654685312165465134654311'
}
url = "XXXXXXXXXXXXXX.com"
payload={}
headers = {
'content-type': 'application/x-www-form-urlencoded; charset=UTF-8',
'x-requested-with': 'XMLHttpRequest',
'Access-Control-Allow-Origin': '*',
'accept': 'application/json, text/javascript, */*; q=0.01',
'referer': 'XXXXXXXXXXX.com'
}
client = ScraperAPIClient(S_API_KEY['key'])
resp = client.post(url = url, body = payload, headers = headers)
yield HtmlResponse(resp.url, body = resp.text,encoding = 'utf-8')
奇怪的是,当我在 scrapy shell 中分段执行此脚本时,它工作正常并返回正确的数据,任何对此问题的见解将不胜感激?目前解决这个问题需要 4 个小时。
注意事项:
- Client.post 返回一个响应对象
- 不是我真正的 API 密钥
- client.post 没有正文方法
【问题讨论】: