【发布时间】:2012-10-13 10:55:21
【问题描述】:
我正在尝试从特定网页获取 HTML 代码,但是当我这样做时使用
HttpWebRequest request;
HttpWebResponse response;
StreamReader streamReader;
request = (HttpWebRequest)WebRequest.Create(pageURL);
response = (HttpWebResponse)request.GetResponse();
streamReader = new StreamReader(response.GetResponseStream(), Encoding.GetEncoding("windows-1251"));
htmlCode = streamReader.ReadToEnd();
streamReader.Close();
或使用 WebClient,我被重定向到登录页面并获得其代码。 有没有其他方法可以获取 HTML 代码?
我在这里阅读了一些信息:How to get HTML from a current request, in a postback,但不明白我应该做什么,或者如何以及在哪里指定 URL。
附: 我在浏览器中登录。 Notepad++ 通过“右键-查看源代码”完美得到了我需要的东西。
谢谢。
【问题讨论】:
-
听起来该页面希望您在登录会话中访问该页面。您必须首先模拟登录以获取会话(最有可能使用 Cookie - 为此使用 CookieContainer),然后访问该页面。