【发布时间】:2013-03-24 14:16:24
【问题描述】:
我正在尝试使用StubHub API 抓取一些销售数据。此处显示此数据的示例:
https://sell.stubhub.com/sellapi/event/4236070/section/null/seatmapdata
您会注意到,如果您尝试在不登录 stubhub.com 的情况下访问该网址,它将无法正常工作。 You will need to login first.
通过网络浏览器登录后,我会在新选项卡中打开要抓取的 URL,然后使用以下命令检索抓取的数据:
r = requests.get('https://sell.stubhub.com/sellapi/event/4236070/section/null/seatmapdata')
但是,一旦浏览器会话在十分钟后过期,我就会收到此错误:
<FormErrors>
<FormField>User Auth Check</FormField>
<ErrorMessage>
Either is not active or the session might have expired. Please login again.
</ErrorMessage>
我认为我需要通过 cookie 实现会话 ID 以保持我的身份验证有效。
Requests 库文档对于以前从未做过此类事情的人来说非常糟糕,所以我希望你们能提供帮助。
Requests提供的例子是:
s = requests.Session()
s.get('http://httpbin.org/cookies/set/sessioncookie/123456789')
r = s.get("http://httpbin.org/cookies")
print r.text
# '{"cookies": {"sessioncookie": "123456789"}}'
老实说,我无法确定这一点。如何在 POST 请求之间保留 cookie?
【问题讨论】:
-
如果您有删除内容的法律义务,请标记为适度关注并清楚说明情况,我们将采取适当的措施。请不要只编辑问题的正文。
-
这就是我了解 stubhub.com 的方式
标签: python python-3.x python-requests session-cookies