【问题标题】:Filling Forms and Downloading Files - Requests and Python填写表格和下载文件 - 请求和 Python
【发布时间】:2017-08-31 18:39:16
【问题描述】:

我正在尝试废弃these page。我使用请求库来填写表格。这些部分有效,因为当我更改为假期日期或不是 Dt_Ref 表单中的 dd/mm/yyyy 格式时,我会收到警告。

目标是下载填写表格的结果。

1 - 填写表格 2 - 下载生成的文件

这是代码。

*Ps,我在公司代理下工作,所以我使用 HTTPProxyAuth 使用我的凭据登录。

import requests
from requests.auth import HTTPProxyAuth


params = {'Dt_Ref': '20/08/2017', 'TpInstFinanceiro': 'Debentures'}

company_proxy = {"http":"proxy.xxxxx/yyyyyy.pac"}
credenciais = HTTPProxyAuth("qqqqq", "wwwww")

url = 'http://www.anbima.com.br/reune/reune_down.asp'


r = requests.post(url, data = params, proxies = itau_proxy , auth = credenciais)

知道如何下载文件吗?

【问题讨论】:

  • 你得到正确的回应了吗?检查print(r.text) 中的响应数据。这就是你想要的吗?
  • 没有。这将返回页面,该页面将为空白。当我输入these page 的形式时,我被重定向到these page,它开始下载。下载文件对我来说很重要。

标签: python web-scraping python-requests download


【解决方案1】:

您在帖子数据中遗漏了一些重要参数。试试这个params 字典:

params = {
    'TpInstFinanceiro':'DEB', 'Tipo':'1', 
    'Dt_Ref':'02/08/2017', 'saida':'csv'
}

如果您不想要 csv 文件,您可以更改 params['saida'] 值。

【讨论】:

  • 当然。但是我将如何下载这个文件?这就是我正在寻找的解决方案。
  • 可以通过r.content获取csv文件。
  • 插入这些参数后,代码工作了。谢谢。
猜你喜欢
  • 2017-03-10
  • 1970-01-01
  • 2017-07-22
  • 2021-02-01
  • 1970-01-01
  • 2016-09-13
  • 2013-06-18
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多