【发布时间】:2016-03-02 08:59:48
【问题描述】:
需要建议。考虑以下带有文本段落的示例文件。
1
Lorem ipsum dolor sit amet, cum at doming urbanitas mnesarchum. Eum ad paulo inermis. Iuvaret minimum mnesarchum ad mei. Dolores placerat pro ex.
Vel zril facete utamur et. Id dicam fuisset contentiones mea, vidisse sapientem consequuntur his ex. Vivendum liberavisse ut usu, mel habeo postea disputationi id.
Timeam aliquid nec no, ex duo option dolorum appareat. Ut tota interesset vim, ne graeci principes sea. Mel et postulant repudiare, eos an populo appareat,
qui placerat iudicabit instructior at. Qui sint malis an.
1
2
Ne mutat putant omnium eos, cu duo malis molestie reprehendunt. Te duo adhuc posse graecis, inermis mediocrem sed te.
Eam cu latine eruditi electram, populo nemore suscipit vim ei, hinc reformidans voluptatibus pri te. Ut suas sanctus epicurei eam,
legimus luptatum ei duo. No mel recteque scriptorem referrentur, ne mel duis cetero consequat, id possit offendit mel.
2
3
3
4
Eu usu tamquam docendi, eum at facer semper sententiae, veritus deserunt ei vis. Id albucius insolens mea, sea ad amet nibh.
Sed id epicuri luptatum liberavisse, mei etiam scripta no. Quod detracto ei qui, imperdiet posidonium in eos.
4
:
:
N
:
N
这里的分隔符是段落本身的序列号。
(即)
[Line Break]Number[Line Break]Passage[Line Break]Number[Line Break]
我可以通过哪些方法/方式更快地将这些段落拆分为单独的文件,而不是逐行迭代它们。
虽然我现在正在使用 C# 和 SQL,但我也听说 Phyton 在这些类型的操作中要快得多。所以我也可以尝试任何其他选项。
编辑: 为了清楚起见,我将它们作为文本段落作为示例。这些段落是其他模块的实际说明/输入。更清楚地说,这些段落将包含数字。
【问题讨论】: