【发布时间】:2016-09-19 17:01:36
【问题描述】:
我的任务是将 BB 代码转换为 WIKI 符号,然后将其转换为 SO 上的许多示例,因此我已经破解了大多数棘手的问题。这是我第一次尝试 Regex,我正在尝试学习它(我更喜欢 stringbuilder,但它似乎不适用于 BB 代码)。我有 4 个需要更换的项目,但我似乎无法创建正确的模式来识别:(左边是原始字符串,在双破折号后右边是我需要的)
第一项是问题子项,因为 wiki 引擎在空格所在的位置添加了一个新行。它不是一个单独的字段,而是一个较大字符串的一部分,所以我不能 TRIM() 它。我目前正在使用
result = result.Replace("[b]", "*").Replace("[/b]", "*");
img 问题是需要以某种方式在给定格式中包含属性(如果可能)。
对于最后两个我很难过。我用过
Regex r = new Regex(@"<a .*?href=['""](.+?)['""].*?>(.+?)</a>");
foreach (var match in r.Matches(multistring).Cast<Match>().OrderByDescending(m => m.Index))
{
string href = match.Groups[1].Value;
string txt = match.Groups[2].Value;
string wikilink = "[" + txt + "|" + href + "]";
sb.Remove(match.Groups[2].Index, match.Groups[2].Length);
sb.Insert(match.Groups[2].Index, wikilink);
}
过去用于 HTML,但似乎无法根据我当前的需求对其进行重构。建议,资源链接,将不胜感激。
编辑 解决了 img 问题,尽管它并不漂亮,我仍然冒着删除可能不会更早发现的结束 [/img] 标记的风险。 [img] 代码比较一致,所以我用了:
Regex imgparser = new Regex(@"\[img[^\]]*\]([^\[]*)");
foreach (var itag in imgparser.Matches(multistring).Cast<Match>().OrderByDescending(m => m.Index))
{
string isrc = itag.Groups[1].Value;
string wikipic = itag.ToString().Replace("[img ", "!" + isrc).Replace("width=", "!width=").Replace("height=", ",height=").Replace("]" + isrc, string.Empty);
result = result.Replace(itag.ToString(), wikipic);
}
result = result.Replace("[/img]", "!");
【问题讨论】:
-
3)
\[url=(mailto:[^]]*)].*?\[/url]->[$1]。 4)\[url=(http[^]]*)](.*?)\[/url]-->[$2|$1].