【发布时间】:2019-11-05 20:16:08
【问题描述】:
我有一些文件有“TITLE...”,然后有“JOURNAL...”紧随其后。特定的行是多种多样的,并且每个文件都不是静态的。我正在尝试提取“... TITLE ...”和“... JOURNAL ...”之间存在的所有信息。到目前为止,我只能提取包含“TITLE”的行,但对于某些文件,它会溢出到下一行。
我推断我必须使用 a=line.find("TITLE") 和 b=line.find("JOURNAL") 然后设置 for i in range(a,b): 的 for 循环:显示 698-768 字符串的所有数值,但只显示数字而不是字符串。如何显示字符串?那么我该如何清理它以不显示“TITLE”、“JOURNAL”以及这两者之间的空格和我需要的文本?谢谢!
这是显示“TITLE”所在的单行
def extract_title():
f=open("GenBank1.gb","r")
line=f.readline()
while line:
line=f.readline()
if "TITLE" in line:
line.strip("TITLE ")
print(line)
f.close()
extract_title()
这是当前块,在单独的行上按升序显示所有这些数字。
def extract_title():
f=open("GenBank1.gb","r")
line=f.read()
a=line.find("TITLE")
b=line.find("JOURNAL")
line.strip()
f.close()
if "TITLE" in line and "JOURNAL" in line:
for i in range(a,b):
print(i)
extract_title()
目前,我从 698-768 显示如下: 698 699 700 ETC... 我想先让他们像,698 699 700, 然后将它们转换为它们的字符串值 然后我想了解如何去除空格以及“TITLE”和“JOURNAL”值。谢谢!
【问题讨论】:
标签: python string file parsing