【发布时间】:2019-10-24 11:41:34
【问题描述】:
这是我正在使用的代码:
for i in article_list:
f = open(i)
first_line = f.readline().strip().split()
for j, line in enumerate(f):
if j == 0:
date_article = word_tokenize(line)
if j >= 3:
lines = lines + " " + line
f.close()
word = word_tokenize(lines)
lines = ""
之后我应该用我的 word[ ] 列表等做一些事情...... 我清空这些行的原因是,每次我用[]这个词做东西时,我也会清除它......
现在我的 article_list 包含我应该使用(阅读)的所有 .txt 文件的确切路径。 我的结构如下:
-Folder A (example Main_Folder)
--Folder 1 (example: 2015-01-01)
---file1.txt (example: 99628.txt)
---file2.txt (example: 99629.txt)
---file3.txt (example: 99630.txt)
--Folder 2 (example: 2015-01-02)
---file4.txt (example: 99631.txt)
---file5.txt
等等
现在读取时,第一个文件夹仅包含一个 txt 文件,并且正在读取。 但是其他文件夹有多个 .txt 文件,并且没有一个文件读取第一个文件。 我的子文件夹都是日期,如 2015-01-01 等,我所有的文件都是数字,如 99621.txt1 目录中的第一个和最后一个文件,我的意思是文件夹 1、文件夹 2 等...文件夹
一个文件的例子是这样的:
ABCD DEFG GGHI
2015-01-01
Report by John Doe
Report starts...
Multiple lines of report
Report Ends
这里重要要注意每个文件中都读取了 first_line...,即我的代码中的 first_line 确实返回 ABCD DEFG GGHI。 还有一个问题是,即使第一行是 ABCD DEFG GGHI,当我使用带有 j 的枚举函数时,行 我在我的代码中取 j == 0,正在读取日期......但我想要它,即使它按照代码被破坏,它也可以工作,所以我不想在那里修复,除非它影响休息...
与文件的其余部分类似(我想是因为我从 f 中读取了一行,然后枚举了其余部分)。
主要问题:
但是,现在,在文件夹的第一个文件(第一个文件夹除外)中,报告的内容没有被读取...行和 word[ ] 在第一个文件中都返回空。 日期,但是 STILL BEING READ j==0
如果你能复制问题,请帮助我
【问题讨论】:
标签: python-3.x