【发布时间】:2013-05-30 06:08:21
【问题描述】:
我正在尝试使用以下代码读取 c# 中 https url 的 html 源代码:
WebClient webClient = new WebClient();
string htmlString = w.DownloadString("https://www.targetUrl.com");
这对我不起作用,因为我得到了编码的 html 字符串。我尝试使用 HtmlAgilityPack 但没有任何帮助。
HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
doc.LoadHtml(htmlString);
【问题讨论】:
-
this doesn't work for me as i get encoded html string是什么意思? -
表示它不适用于targetUrl.com的HTTPS链接
-
WebClient.DownloadString不需要执行任何特殊操作即可从 https 地址下载。你是什么意思“编码”?你怎么知道它是编码的?它看起来像什么? -
我们这里没有水晶球。你能指望什么?你看到了什么?你得到什么例外?
标签: c# html .net html-agility-pack