【问题标题】:urllib2 does not download pdf fileurllib2 不下载 pdf 文件
【发布时间】:2013-03-18 08:42:41
【问题描述】:

我正在使用以下代码下载我的文件:

def downloadfile(url): #function to download file    
    file_name = filename_parse(url)
    #print "***********************"
    #print "File download started:"
    #stime= time.time()
    u = urllib2.urlopen(url)
    f = open(file_name, 'wb')
    getfilesize(u)
    file_size = getfilesize(u)
    print "Downloading: %s Bytes: %s \n" % (file_name, file_size)
    file_size_dl = 0
    block_sz = 512
    progressbar(u,block_sz,file_size_dl,f,file_size)
f.close()

问题是它可以下载除 .pdf 文件之外的任何文件 exe、txt 和其他文件……我怎样才能让它下载 pdf 文件?

【问题讨论】:

  • 当你给它一个 PDF 时会发生什么?
  • 是的,我在哪里卡住了? u.getcode()u.info() 是什么,你也没有向我们展示你是如何实际获取数据的,urlopen() 只是打开 url.. 它不获取数据(通常通过 .read() 或其他东西)
  • 使用curl 确保您的服务器在被要求提供 PDF 文件时没有执行任何异常操作。
  • 问:可以用普通的浏览器下载PDF吗?
  • 是的 pdf 可以使用普通浏览器下载。 Torxed 我将使用 .read() 编辑帖子

标签: python pdf download urllib2


【解决方案1】:

我知道这是一个老问题,但对于所有偶然发现它并想要使用 python 2 和 urllib2 下载 pdf 文件的人来说,这里是代码:

import urllib2
url = 'http://mensenhandel.nl/files/pdftest2.pdf'
print "Download started..."
f = urllib2.urlopen(url)
data = f.read()
with open("test.pdf", "wb") as code:
    code.write(data)
print "Download completed..."

只需根据您的需要修改 URL...

来源:http://www.blog.pythonlibrary.org/2012/06/07/python-101-how-to-download-a-file/

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2018-09-10
    • 2011-06-13
    • 1970-01-01
    • 1970-01-01
    • 2017-04-30
    • 1970-01-01
    相关资源
    最近更新 更多