【问题标题】:File download via Post form通过 Post 表单下载文件
【发布时间】:2013-03-16 19:45:54
【问题描述】:

有一个网站列出了我要下载的文件。为了简化这个过程,我尝试编写一个脚本来为我做这件事。 (虽然我可以同时选择多个选项,但点击提交只会下载第一个文件)

网页 url,webpage/list.php,与表单中的操作不同。我不确定在此处发布实际网址的政策是什么。

<form action="webpage/data.php" method="post">
  <table align="center">
    <tbody>
      <tr><td>
        <select name="data[]" size="8" multiple="multiple">
          <option value="downloadable_file1.tar">Downloadable file1</option>
          <option value="downloadable_file2.tar">Downloadable file2</option>
          <option value="downloadable_file3.tar">Downloadable file3</option>
        </select>
      </td></tr>
    </tbody>
  </table>
  <input type="submit">
</form>

我的脚本是这样的:

import urllib
import urllib2
import shutil

req = urllib2.Request('webpage/list.php')
values = { 'data[]': 'downloadable_file1.tar'}
req.add_data(urllib.urlencode(values))
resp = urllib2.urlopen(req)

myfile = open('downloadable_file1.tar', 'wb')
shutil.copyfileobj(resp.fp, myfile)
myfile.close()

运行脚本时,服务器似乎没有确认请求,只是为我提供带有文件列表的同一个网页。有没有我错过的选项?可能有som重定向问题吗?

这是我在使用 Chrome 时得到的信息:

Request URL:webpage/data.php  
Request Method:POST  
Status Code:200 OK  

Accept:text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8  
Accept-Charset:ISO-8859-1,utf-8;q=0.7,*;q=0.3  
Accept-Encoding:gzip,deflate,sdch  
Accept-Language:sv-SE,sv;q=0.8,en-US;q=0.6,en;q=0.4  
Cache-Control:max-age=0  
Connection:keep-alive  
Content-Length:26  
Content-Type:application/x-www-form-urlencoded  
Host:webpage 
Origin:webpage  
Referer:webpage/list.php  
User-Agent:Mozilla/5.0 (Macintosh; Intel Mac OS X 10_6_8) AppleWebKit/537.22 (KHTML, like Gecko) Chrome/25.0.1364.172 Safari/537.22  
data[]:downloadable_file1.tar  

Accept-Ranges:bytes  
Cache-control:private  
Connection:Keep-Alive  
Content-Disposition:attachment; filename="downloadable_file1.tar.gz"  
Content-Length:1043436  
Content-Transfer-Encoding:binary  
Content-Type:application/x-gzip  
Date:Tue, 26 Mar 2013 20:18:58 GMT  
Expires:Mon, 26 Jul 1997 05:00:00 GMT  
Keep-Alive:timeout=5, max=100  
Pragma:private  
Server:Apache/2.2.9 (FreeBSD) mod_ssl/2.2.9 OpenSSL/0.9.7e-p1 DAV/2 PHP/5.2.6 with Suhosin-Patch
X-Powered-By:PHP/5.2.6  

【问题讨论】:

    标签: python forms post download


    【解决方案1】:

    您应该考虑使用“请求”库:http://docs.python-requests.org/en/latest/

    我相信这可以使用 requests 库来完成:

    data={'data[]':'downloadable_file1.tar'}
    req = requests.post('webpage/data.php', data)
    with open('file.data', 'wb') as file:
        file.write(req.content)
    

    【讨论】:

      【解决方案2】:

      行:

      req = urllib2.Request('webpage/list.php')
      

      正在请求原始网页,但表单将数据发布到 webpage/data.php。这样做效果更好吗?

      req = urllib2.Request('webpage/data.php')
      

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 2023-03-19
        • 1970-01-01
        • 1970-01-01
        • 2016-06-03
        • 1970-01-01
        相关资源
        最近更新 更多