【发布时间】:2015-01-23 17:10:46
【问题描述】:
我需要从文档或字符串(从用户粘贴的文本)中获取文本,并将其拆分为一个二维数组,其中每个部分是一个段落,其中的值是句子。如果这会影响任何事情,我会将其作为 winform 执行。
到目前为止,我已经有了它,所以我可以创建一个基本数组来保存每个段落的文本,以“\n”区分(这确实会导致标题等内容独立,但这很好)。但是我还需要将每个句子用“。”分隔,并形成提到的二维数组。
到目前为止我的代码是:
public void sentenceSplit()
{
content = File.ReadAllText(documentPath);
content = Regex.Replace(content, @"^\s+$[\r\n]*", "", RegexOptions.Multiline);
string[] paragraphs = content.Split('\n');
TextboxSummary.Text = string.Join("\n \n", paragraphs);
}
需要正则表达式,因为它会删除完全空的行,否则由于双“\n”的情况而添加为数组条目。
我之前没有处理过创建这样的二维数组,并且不确定是否可以在我只声明 2 个拆分值而不是 1 的一行中完成。
【问题讨论】:
标签: c# arrays regex string split