【发布时间】:2014-12-26 11:46:55
【问题描述】:
如何下载使用基于 java 的加载机制的网页? 由于站点机制,下面的代码返回几乎空的文档。 在浏览器中查看时,您会看到“正在加载...”,并在一段时间后显示内容。 我也想避免使用 WebBrowser 控件。
HtmlDocument doc = new HtmlDocument();
HttpWebRequest req = (HttpWebRequest)WebRequest.Create(url);
req.AutomaticDecompression = DecompressionMethods.Deflate | DecompressionMethods.GZip;
if (!string.IsNullOrWhiteSpace(userAgent))
req.UserAgent = userAgent;
if (cookies != null)
{
req.CookieContainer = new CookieContainer();
foreach (Cookie c in cookies)
req.CookieContainer.Add(c);
}
var resp = req.GetResponse();
var resp_str = resp.GetResponseStream();
using (StreamReader sr = new StreamReader(resp_str, Encoding.GetEncoding("windows-1251")))
{
string r = sr.ReadToEnd();
doc.LoadHtml(r);
}
return doc;
【问题讨论】:
标签: java c# download httpwebrequest