【问题标题】:C#, how to get the content of a webpage?C#,如何获取网页的内容?
【发布时间】:2011-06-24 21:41:22
【问题描述】:

我是 C# 新手。我需要编写一个脚本来获取网页的 HTML 内容。我在哪里可以获得有关如何执行此操作的示例?我在这里搜索过,但找不到。

PS:对不起我的英语。

最好的问候,

【问题讨论】:

标签: c# asp.net screen-scraping


【解决方案1】:

查看WebClient 类。 DownloadString 方法以字符串形式返回页面内容:

var wc = new WebClient();
var html = wc.DownloadString("http://stackoverflow.com");

如果你也想解析下载的HTML,那么你可以看看HTML Agility Pack。它允许您将 HTML 解析为树状结构(类似于 XmlDocument),并且您可以使用 XPath 在文档中查找元素等。这比使用正则表达式或自己解析内容要好得多。

【讨论】:

    猜你喜欢
    • 2010-11-06
    • 2016-12-07
    • 2011-07-15
    • 2011-01-23
    • 1970-01-01
    • 2011-10-12
    • 2013-05-01
    • 2012-09-06
    • 1970-01-01
    相关资源
    最近更新 更多