【发布时间】:2010-12-16 01:24:58
【问题描述】:
我正在尝试使用 C# 和 Linq to XML 读取 RSS 提要。 提要以 utf-8 编码(请参阅http://pc03224.kr.hsnr.de/infosys/feed/),除了描述节点外,它通常可以正常读取,因为它包含在 CDATA 部分中。
由于某种原因,在读出“description”标签的内容后,我在调试器中看不到 CDATA 标签,但我想它一定在某个地方,因为只有在本节中,德语变音符号 (äöü) 和其他特殊字符显示不正确。相反,它们保留在编码为 ü 的字符串 utf-8 中。
我可以以某种方式正确地读出它们,或者至少在之后解码它们吗?
这是给我带来麻烦的 RSS 部分的示例:
<description><![CDATA[blabla bietet Hörern meiner Vorlesungen “IAS”, “WEB” und “SWE” an, Lizenzen für blabla [...]]]></description>
这是我读取并解析 RSS 提要数据的代码:
RssItems = (from xElem in xml.Descendants("channel").Descendants("item")
select new RssItem
{
Content = xElem.Descendants("description").FirstOrDefault().Value,
...
}).ToList();
提前致谢!
【问题讨论】:
标签: c# encoding rss linq-to-xml cdata