urllib2 不下载 pdf 文件答案

【问题标题】：urllib2 does not download pdf fileurllib2 不下载 pdf 文件
【发布时间】：2013-03-18 08:42:41
【问题描述】：

我正在使用以下代码下载我的文件：

def downloadfile(url): #function to download file    
    file_name = filename_parse(url)
    #print "***********************"
    #print "File download started:"
    #stime= time.time()
    u = urllib2.urlopen(url)
    f = open(file_name, 'wb')
    getfilesize(u)
    file_size = getfilesize(u)
    print "Downloading: %s Bytes: %s \n" % (file_name, file_size)
    file_size_dl = 0
    block_sz = 512
    progressbar(u,block_sz,file_size_dl,f,file_size)
f.close()

问题是它可以下载除 .pdf 文件之外的任何文件 exe、txt 和其他文件……我怎样才能让它下载 pdf 文件？

【问题讨论】：

当你给它一个 PDF 时会发生什么？
是的，我在哪里卡住了？ u.getcode() 和 u.info() 是什么，你也没有向我们展示你是如何实际获取数据的，urlopen() 只是打开 url.. 它不获取数据（通常通过 .read() 或其他东西）
使用curl 确保您的服务器在被要求提供 PDF 文件时没有执行任何异常操作。
问：可以用普通的浏览器下载PDF吗？
是的 pdf 可以使用普通浏览器下载。 Torxed 我将使用 .read() 编辑帖子

标签： python pdf download urllib2

【解决方案1】：

我知道这是一个老问题，但对于所有偶然发现它并想要使用 python 2 和 urllib2 下载 pdf 文件的人来说，这里是代码：

import urllib2
url = 'http://mensenhandel.nl/files/pdftest2.pdf'
print "Download started..."
f = urllib2.urlopen(url)
data = f.read()
with open("test.pdf", "wb") as code:
    code.write(data)
print "Download completed..."

只需根据您的需要修改 URL...

来源：http://www.blog.pythonlibrary.org/2012/06/07/python-101-how-to-download-a-file/

【讨论】：