【发布时间】:2013-09-27 10:44:10
【问题描述】:
我需要获取一个从 aspx 网站生成的 pdf 文件。
背景故事:
我想从网站获取日程安排,我已成功获取到日程安排的 url,其中包含参数。如果您点击 url,您将看到一个由网站使用给定参数创建的 PDF 流。
站点使用此 URL 来获取适当的日程安排并将其显示为 pdf。 由于理论上它不是 PDF 文件,因此我无法将其作为一个文件下载:
Dim Downloader As New WebClient
Downloader.DownloadFile(URL, fileName)
我也不能使用...将内容下载为字符串
Dim Downloader As New WebClient
Dim Result As String = Downloader.DownloadString(URL)
...因为它会由于缺少参数而导致 500 服务器错误。
显示文件/流/文档或其真实名称的唯一方法是通过浏览器访问给定的 url。鉴于此,我尝试通过 WebBrowser 控件获取 PDF。但由于它“无法显示 XML 页面”(导航到计划 URL 时显示错误)我也不能使用这种方法。
所以我的问题是,我如何将这些数据下载为 PDF 或如何将这些数据作为我可以使用 StreamReader 读取的流?
旁注:
该页面不再使用客户端连接,因此我无法回溯它。 (我使用 Fiddler2 跟踪所有连接)
使用 Fiddler,我可以看出 URL SomethingSomething.com/Something.aspx 会生成 PDF 并显示它。生成文档的前几行(通过 Fiddler)
%PDF-1.4
%����
%
%wPDF by WPCubed GmbH V3.54x[0]
%
%
1 0 个对象
我可以从 Fiddler 那里获得有关此站点的更多信息,因此,如果您需要,请自行尝试或让我在此处添加信息。
【问题讨论】: