【发布时间】:2018-10-08 20:23:50
【问题描述】:
我正在尝试解析一些其中包含一堆转义字符的 HTML,很多 \t、\n、\r,每个双引号都用反斜杠转义。示例 HTML:
<div id=\"error-modal\" title=\"Retrieving Document Error\" class=\"text-hide\">\n We're sorry, we were unable to retrieve your requested document or image.</div>
我正在尝试通过这样做来替换这些字符:
var xpar = new XML.Parser(wConn.RawString.Replace("\\n", "").Replace("\\t", "").Replace("\\r","").Replace("\\\"", "\""))
解析器出错是因为它不喜欢 HTML 中的其他内容,但在例外情况下,字符串与以前相同,反斜杠仍然存在。我做错了什么?
【问题讨论】:
-
你确定那些反斜杠真的存在吗?可能是调试器显示带有转义引号等的字符串。
-
使用 System.Net.WebUtility.HtmlDecode(string) 和 System.Net.WebUtility.HtmlEncode(string)。见维基:en.wikipedia.org/wiki/…