【发布时间】:2016-06-28 02:44:46
【问题描述】:
我一直在尝试抓取以下Website 但是随着货币从左上角设置表单更改为“SAR”,我尝试发送这样的scrapy请求:
r = Request(url='https://www.mooda.com/en/', cookies=[{'name': 'currency',
'value': 'SAR',
'domain': '.www.mooda.com',
'path': '/'}, {'name':'country','value':'SA','domain': '.www.mooda.com','path':'/'}],dont_filter=True)
我仍然得到 EG 的价格
In [10]: response.css('.price').xpath('text()').extract()
Out[10]:
[u'1,957 EG\xa3',
u'3,736 EG\xa3',
u'2,802 EG\xa3',
u'10,380 EG\xa3',
u'1,823 EG\xa3']
我还尝试发送带有指定表单数据的发布请求 像这样:
from scrapy.http.request.form import FormRequest
url = 'https://www.mooda.com/en/'
r = FormRequest(url=url,formdata={'selectCurrency':'https://www.mooda.com/en/directory/currency/switch/currency/SAR/uenc/aHR0cHM6Ly93d3cubW9vZGEuY29tL2VuLw,,/'})
fetch(r)
它仍然无法正常工作,也尝试使用 FormRequest.from_response() 但它永远不会工作,我真的很喜欢一些建议,我是scrapy表单请求的新手,如果有人可以提供帮助,我将不胜感激
【问题讨论】:
标签: python web-scraping scrapy scrapy-spider scrapy-shell