【问题标题】:python does not read the first and the last files from a sub-directory (last file sometimes, first files always)python 不会从子目录中读取第一个和最后一个文件(有时是最后一个文件,总是第一个文件)
【发布时间】:2019-10-24 11:41:34
【问题描述】:

这是我正在使用的代码:

for i in article_list:
    f = open(i)
    first_line = f.readline().strip().split()
    for j, line in enumerate(f):
        if j == 0:
            date_article = word_tokenize(line)
        if j >= 3:
            lines = lines + " " + line
    f.close()
    word = word_tokenize(lines)
    lines = ""

之后我应该用我的 word[ ] 列表等做一些事情...... 我清空这些行的原因是,每次我用[]这个词做东西时,我也会清除它......

现在我的 article_list 包含我应该使用(阅读)的所有 .txt 文件的确切路径。 我的结构如下:

-Folder A    (example Main_Folder)
--Folder 1    (example: 2015-01-01)
---file1.txt    (example: 99628.txt)
---file2.txt    (example: 99629.txt)
---file3.txt    (example: 99630.txt)
--Folder 2    (example: 2015-01-02)
---file4.txt    (example: 99631.txt)
---file5.txt

等等

现在读取时,第一个文件夹仅包含一个 txt 文件,并且正在读取。 但是其他文件夹有多个 .txt 文件,并且没有一个文件读取第一个文件。 我的子文件夹都是日期,如 2015-01-01 等,我所有的文件都是数字,如 99621.txt1 目录中的第一个和最后一个文件,我的意思是文件夹 1、文件夹 2 等...文件夹

一个文件的例子是这样的:

ABCD DEFG GGHI
2015-01-01
Report by John Doe
Report starts...
Multiple lines of report
Report Ends

这里重要要注意每个文件中都读取了 first_line...,即我的代码中的 first_line 确实返回 ABCD DEFG GGHI。 还有一个问题是,即使第一行是 ABCD DEFG GGHI,当我使用带有 j 的枚举函数时,行 我在我的代码中取 j == 0,正在读取日期......但我想要它,即使它按照代码被破坏,它也可以工作,所以我不想在那里修复,除非它影响休息...

与文件的其余部分类似(我想是因为我从 f 中读取了一行,然后枚举了其余部分)。

主要问题

但是,现在,在文件夹的第一个文件(第一个文件夹除外)中,报告的内容没有被读取...行和 word[ ] 在第一个文件中都返回空。 日期,但是 STILL BEING READ j==0

如果你能复制问题,请帮助我

【问题讨论】:

    标签: python-3.x


    【解决方案1】:

    没关系...一些文件有一个空行用于我按人员行的报告...并且由于那里没有读取 \n,如果启动了 j>=3,它将全部读取为空

    【讨论】:

      猜你喜欢
      • 2021-03-06
      • 2021-08-20
      • 1970-01-01
      • 2021-03-06
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2016-11-08
      • 1970-01-01
      相关资源
      最近更新 更多