【发布时间】:2017-01-31 10:37:34
【问题描述】:
我正在尝试使用 Python 来提取以下标题之间的文本:
@HEADER1
ExtractMe
ExtractMe
ExtractMe
ExtractMe
ExtractMe
ExtractMe
ExtractMe
ExtractMe
ExtractMe
@othertext
@HEADER1 + @othertext 的确切文本可能会随着时间而改变。所以我需要保持活力。
另外,HEADER2 是一个以'@' 开头的词。那么我可以使用startswith 函数吗?还是正则表达式?
类似的东西。
For line in file:
if(line == 'HEADER1'):
print next line
continue = TRUE
if(continue == TRUE):
print(line)
elif(line == othertext):
break
【问题讨论】:
-
您的内容中没有
HEADER2 -
line.startswith("@")会找到以@开头的单词 -
不要做
if line == '@HEADER1',做if line.startswith('@HEADER1')。使用第一个选项,您会忘记换行符。并且不要使用 python 内置的continue。For也用小写“f”拼写 -
你不应该考虑
@等吗?
标签: python regex python-3.x text-extraction