【发布时间】:2016-04-22 05:02:37
【问题描述】:
我有一个包含大量文本信息的大文本文件,但我想提取两个已定义文本之间的文本。 例如
/begin MEASUREMENT XYZ
UBYTE
_CNV_A_R_LINEAR_____71_CM
1
100.
-40.
160.
FORMAT "%3.0"
SYMBOL_LINK "XYZ" 0
/begin IF_DATA EVTRKMNBXERTBK
DEFAULT_RASTERS 3 3
/end IF_DATA
/end MEASUREMENT
即 /begin MEASUREMENT 和 /end MEASUREMENT 在这之间我想提取文本。
我的代码是:
import re
path = r"d:\xyz.txt"
file = open(path, 'r')
lines = file.read()
pattern = re.compile(r'begin MEASUREMENT[\s][\w+](.*?)end MEASUREMENT')
print re.findall(pattern, lines)
【问题讨论】: