【发布时间】:2013-06-18 13:00:21
【问题描述】:
我正在阅读 C# 中的网站并以字符串形式获取内容....有些网站没有格式良好的 html 结构。
我正在使用 HtmlAgilityPack 在这种情况下会给我带来问题。
你们能否建议我使用什么,以便它可以读取整个字符串并且我可以获得有用的信息?
这是我的代码
htmlDoc.LoadHtml(s);
if (htmlDoc.ParseErrors != null && htmlDoc.ParseErrors.Count() > 0)
为什么这个 IF 条件适用于我的情况
【问题讨论】:
-
相信
ParseErrors收藏可以回答你的问题 -
我认为,您的 HTML 无效。你能提供s的值吗?
-
@speti43 是的,我知道我的 html 无效,这就是我在问题中提到的......我无法更正 html,因为它直接来自网页......现在该怎么办?
标签: c# html .net parsing html-agility-pack