【问题标题】:How to remove all <a></a> tags from a large html string in C#?如何从 C# 中的大 html 字符串中删除所有 <a></a> 标签?
【发布时间】:2011-05-23 05:14:09
【问题描述】:

我有一大串 HTML,我已经解析了其中包含一堆已经形成的链接。我正在寻找一种快速方法来摆脱所有链接以仅显示文本。感谢您提供任何帮助或建议!

示例 html 字符串如下所示:

<A href="test.com">myText</A>, <A href="test1.com">myText</A>, <A href="test2.com">myText</A>, <A href="differenttesturl.com">myText</A>, <A href="test0.com">myText</A>

我希望 HTML 完成后看起来像这样:

我的文本,我的文本,我的文本,我的文本,我的文本

我在 ASP.NET 页面上使用 C#,并将 HTML 存储为字符串,

谢谢。

【问题讨论】:

标签: c# asp.net html parsing


【解决方案1】:

这是一个使用正则表达式从字符串中剥离 HTML 标记的简单解决方案。

http://www.osherove.com/blog/2003/5/13/strip-html-tags-from-a-string-using-regular-expressions.html

【讨论】:

    【解决方案2】:

    您可以将其转换为 XML 文档并提取所有 Text 节点。

    【讨论】:

      【解决方案3】:

      您想使用 HTML 解析器来执行此操作。

      查看这篇文章了解一些选项

      Looking for C# HTML parser

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 1970-01-01
        • 2014-07-20
        • 1970-01-01
        • 2012-10-15
        • 2015-11-24
        • 1970-01-01
        • 2015-02-23
        • 2015-10-09
        相关资源
        最近更新 更多