【发布时间】:2019-10-25 17:15:42
【问题描述】:
我正在尝试从字符串中删除 script 和 link 标记。以下是我到现在得到的。
代码
rawHtml = rawHtml.Remove(rawHtml.IndexOf("<script"), (rawHtml.LastIndexOf("</script>") -
rawHtml.IndexOf("<script")) + 5);
rawHtml = rawHtml.Remove(rawHtml.IndexOf("<link"), (rawHtml.LastIndexOf("/>") -
rawHtml.IndexOf("<link")) + 3);
有没有更好的方法不用手动写数字?
【问题讨论】:
-
如果你想防止xss攻击,看看这个:stackoverflow.com/questions/31064159/…
-
@Sycraw ,不,我只想要没有
script和link标签的html字符串,实际上我会将这个html导出到excel。 -
好的...现在我得到的唯一选择是(如果它是格式良好的 HTML)将其转换为 xmldocument 并使用 xpath 删除标签:stackoverflow.com/questions/20611/… 不知道为了性能,但如果 rawhtml 只是一个字符串,那么使用字符串真的很重,因为它们是值类型,也许这个解决方案可以提高性能