【发布时间】:2013-12-05 22:30:09
【问题描述】:
我正在尝试从网站下载 excel 文件。 我使用 mechanize 成功填写了表单,提交表单应该返回给我一个文件下载。 但是在下载时,它返回给我的是 html 而不是文件的实际内容。
import mechanize
br = mechanize.Browser()
br.open("http://web.sba.gov/pro-net/search/dsp_dsbs.cfm")
br.select_form('SearchForm')
br["States"] = ["AL","AK"]
br["E8a"] = ["Y"]
br["Report"] = ["S"]
response = br.submit()
fileobj = open("szz.txt","wb")
fileobj.write(response.read())
fileobj.close()
结果看起来像
<!doctype html>
<html lang="en-US" dir="ltr">
<head>
<meta charset="utf-8">
<meta http-equiv="X-UA-Compatible" content="IE=Edge">
<title>SBA - Dynamic Search</title>
<link href="/gls/dsp_choosefunction.cfm" accesskey="1" rel="Home" title="Home (Return to GLS Choose Function)">
<link rel="stylesheet" type="text/css" media="all" href="/library/css/jquery.mobile/sba.dtv.css?CachedAsOf=2012-06-20T22:15"/><!-- local code -->
<link rel="stylesheet" type="text/css" media="all" href="/library/css/sczz.strict.css?CachedAsOf=2013-09-20T18:55"/>
<script src="/library/javascripts/jquery/jquery.js?CachedAsOf=2012-09-21T15:37"></script><!-- 1.8.2 -->
<script src="/library/javascripts/jquery/jquery.mobile/sba.jqm.js?CachedAsOf=2013-03-28T16:11"></script><!-- local code -->
<noscript>
<link rel="stylesheet" type="text/css" media="all" href="/library/css/sczz.noscript.css?CachedAsOf=2010-10-14T19:23"/>
</noscript>
<script>
var gSlafDevTestProd = "Prod";
var gSlafDevTestProdInd = "2";
var gSlafInlineBlock = "inline-block";
【问题讨论】:
-
我想要网站的确切网址,以便我自己测试一些代码,然后我可以提供一些答案。
-
@PepperoniPizza 我用正确的 URL 编辑了上面的代码
标签: python submit download urllib2 mechanize