填写表格和下载文件 - 请求和 Python答案

【问题标题】：Filling Forms and Downloading Files - Requests and Python填写表格和下载文件 - 请求和 Python
【发布时间】：2017-08-31 18:39:16
【问题描述】：

我正在尝试废弃these page。我使用请求库来填写表格。这些部分有效，因为当我更改为假期日期或不是 Dt_Ref 表单中的 dd/mm/yyyy 格式时，我会收到警告。

目标是下载填写表格的结果。

1 - 填写表格 2 - 下载生成的文件

这是代码。

*Ps，我在公司代理下工作，所以我使用 HTTPProxyAuth 使用我的凭据登录。

import requests
from requests.auth import HTTPProxyAuth


params = {'Dt_Ref': '20/08/2017', 'TpInstFinanceiro': 'Debentures'}

company_proxy = {"http":"proxy.xxxxx/yyyyyy.pac"}
credenciais = HTTPProxyAuth("qqqqq", "wwwww")

url = 'http://www.anbima.com.br/reune/reune_down.asp'


r = requests.post(url, data = params, proxies = itau_proxy , auth = credenciais)

知道如何下载文件吗？

【问题讨论】：

你得到正确的回应了吗？检查print(r.text) 中的响应数据。这就是你想要的吗？
没有。这将返回页面，该页面将为空白。当我输入these page 的形式时，我被重定向到these page，它开始下载。下载文件对我来说很重要。

标签： python web-scraping python-requests download

【解决方案1】：

您在帖子数据中遗漏了一些重要参数。试试这个params 字典：

params = {
    'TpInstFinanceiro':'DEB', 'Tipo':'1', 
    'Dt_Ref':'02/08/2017', 'saida':'csv'
}

如果您不想要 csv 文件，您可以更改 params['saida'] 值。

【讨论】：

当然。但是我将如何下载这个文件？这就是我正在寻找的解决方案。
可以通过r.content获取csv文件。
插入这些参数后，代码工作了。谢谢。