【问题标题】:(C#) Replacing characters in a string variable(C#) 替换字符串变量中的字符
【发布时间】:2020-03-30 20:59:17
【问题描述】:

我使用 C# 下载网站的 HTML 源代码。我想替换

之间的任何字符
<span class="comment-name" title="

">

我不确定我应该怎么做?我一直在尝试使用正则表达式。

【问题讨论】:

  • 有很多方法可以做到这一点,请根据您的尝试进行更新。
  • 在尝试parse HTML with regex 时始终保持谨慎。一般来说,使用 html passer lit HTMLAgility 包可能会更好。选择具有类 comment-name 的节点并删除 title 属性。

标签: c# html regex


【解决方案1】:

如果整个标签是常量(总是:&lt;span class="comment-name" title="..."&gt;),你可以使用这个正则表达式模式:(&lt;span class=\"comment-name\" title=\")[^\"]+(\"&gt;)

然后您可以将文本替换为第一个捕获组(用引号打开标签到标题),替换文本,然后是第二个捕获组(结束引号和结束标记),如下所示:$1REPLACE$2(注意:替换文字REPLACE 随你所需)

此替换更改:&lt;span class="comment-name" title="..."&gt;&lt;span class="comment-name" title="REPLACE"&gt;

在 C# 中,您可以在一行中完成此操作:

Regex.Replace(text, "(<span class=\"comment-name\" title=\")[^\"]+(\">)", "$1REPLACE$2");

【讨论】:

    【解决方案2】:

    很简单,写一个这样的函数:

    string Between(string str, string firstString, string lastString)
    {    
     int pos1 = str.IndexOf(firstString) + firstString.Length;
     int pos2 = str.Substring(pos1).IndexOf(lastString);
     return str.Substring(pos1, pos2);
    }
    

    然后这样称呼它:

    string myString = Between(mainString, "title=\"", """;
    

    Source Source 2

    【讨论】:

    • 当然正文包含字符串 title="Something" 那么它也会被替换。
    猜你喜欢
    • 2020-07-09
    • 2013-02-16
    • 1970-01-01
    • 2020-02-04
    • 1970-01-01
    • 1970-01-01
    • 2017-06-21
    • 2011-10-20
    相关资源
    最近更新 更多