【发布时间】:2013-09-15 07:42:21
【问题描述】:
我正在实现泰米尔语的词法解析。 我需要通过以下条件替换文本元素值
string[] ugaramStrings = { "கு", "சு", "டு", "து", "பு", "று" };
string[] tamilvowels =
{
"அ",// "\u0b85"
"ஆ",//"\u0b86"
"இ",//"\u0b87"
"ஈ",//"\u0b88"
"உ",//"\u0b89"
"ஊ",//"\u0b8A"
"எ",// "\u0b8E"
"ஏ",//"\u0b8F"
"ஐ",//"\u0b90"
"ஒ",//"\u0b92"
"ஓ",//"\u0b93"
"ஔ"//"\u0b94"
};
如果任何单词具有连续的 ugaramStrings 元素和泰米尔元音元素。 是否需要替换 ugaram 字符串并返回值。
例如அமர்ந்*துஇ*னிது替换为அமர்ந்*இ*னிது。 即துஇ=>இ
我已经通过使用TextElementEnumerator 类检查下一个字符串元素来完成它。 是否有任何可能,以便使用RegularExpression替换它
【问题讨论】:
标签: c# .net regex unicode tamil