【发布时间】:2011-04-28 21:09:56
【问题描述】:
我想在文档中搜索一个关键字,然后检查该关键字是否在另一个关键字的 5 行之内。如果是,我想打印该行和后面的 50 行。
在这个例子中,我在文档中搜索“carrying”这个词,我想确保“carrying”这个词在“Financial Assets:”这个词的 5 行之内,我的代码能够找到并打印当我只包含搜索“carrying”时的行,但是当我包含搜索“Financial Assets:”时,它没有找到任何东西(即使我知道它在文档中)。
import urllib2
data = []
html = urllib2.urlopen("ftp://ftp.sec.gov/edgar/data/1001627/0000950116-97-001247.txt")
searchlines = html.readlines()
for m, line in enumerate(searchlines):
line = line.lower()
if "carrying" in line and "Financial Assets:" in searchlines[m-5:m+5]:
for l in searchlines[m-5:m+50]:
data.append(l)
print ''.join(data)
任何帮助将不胜感激。
【问题讨论】: