【问题标题】:XML Parsing with HtmlAgilityPack使用 HtmlAgilityPack 进行 XML 解析
【发布时间】:2014-07-05 22:54:57
【问题描述】:

我在 WebService 辅助角色上使用 HtmlAgilityPack 解析 xml,但出现了问题。当我选择子节点“链接”时,得到空字符。 xml 之类的:

<link>
http://www.webtekno.com/google/google-ve-razer-dan-oyun-konsolu.html
</link>

我从 rss 获取链接的代码是:

HtmlNodeCollection nodeList = doc.DocumentNode.SelectNodes("//item");
foreach (HtmlNode node in nodeList)
{
    string newsUri = node.ChildNodes["link"].InnerText;
}

我认为得到空字符导致链接节点包括新行和链接之后。如何在节点中获取链接?

【问题讨论】:

  • 为什么?你不能使用正确的 XML API(比如XDocument)吗?
  • 我试了一下,问题依旧存在。

标签: c# xml web-services html-agility-pack azure-worker-roles


【解决方案1】:

在加载 HtmlDocument 之前放置该行

HtmlNode.ElementsFlags["link"] = HtmlElementFlag.Closed;

就是这样。

默认情况下,它的值为HtmlElementFlag.Empty 并被视为metaimg 标签...

【讨论】:

  • 感谢您的帮助。
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2013-07-18
  • 2012-02-15
  • 1970-01-01
  • 2019-09-27
  • 1970-01-01
  • 2013-06-25
相关资源
最近更新 更多