【发布时间】:2019-11-19 10:31:47
【问题描述】:
我正在尝试将许多 txt 文件读入我的数据框中,并且此代码在下面有效。但是,它复制了我的一些专栏,而不是全部。我找不到解决方案。我能做些什么来防止这种情况发生?
import pandas as pd
import glob
dfs = pd.DataFrame(pd.concat(map(functools.partial(pd.read_csv, sep='\t', low_memory=False),
glob.glob(r'/folder/*.txt')), sort=False))
假设我的数据应该如下所示:
但它看起来像这样: enter image description here
我不希望我的列被复制。
【问题讨论】:
-
请提供一些输入和输出以便有效地追踪问题。
-
重复是什么意思?你的意思是一个文件的输入出现多次? 'glob.glob(r'/folder/*.txt')' 生成的列表是否具有所需的内容?通过首先创建列表并遍历它并对重复列发出警告来拆分步骤可能会有所帮助,这样您就可以看到哪里出了问题。
标签: python python-3.x pandas dataframe glob