【发布时间】:2020-08-25 18:45:07
【问题描述】:
我有一些代码可以读取某个文件夹中的所有 CSV 文件并将它们连接到一个 excel 文件中。只要 CSV 有标题,此代码就可以工作,但我想知道如果我的 CSV 没有任何标题,是否有办法更改我的代码。
以下是有效的:
path = r'C:\Users\Desktop\workspace\folder'
all_files = glob.glob(path + "/*.csv")
li = []
for filename in all_files:
df = pd.read_csv(filename, index_col=None, header=0)
df = df[~df['Ran'].isin(['Active'])]
li.append(df)
frame = pd.concat(li, axis=0, ignore_index=True)
frame.drop_duplicates(subset=None, inplace=True)
这样做是删除我的 CSV 中“Ran”列下带有“Active”一词的任何行。但是,如果我没有此列的“Ran”标题,是否有其他方法可以阅读并执行相同的操作?
提前致谢!
【问题讨论】:
-
在询问依赖数据的代码时,重要的是在您的问题中包含数据的最小示例。有时您可能想为问题创建假数据 - 只要它忠实地代表实际数据。您越容易让 us 从您的问题中复制和粘贴(以便我们可以执行您的代码并测试我们的解决方案),您获得响应的可能性就越大。 - 请阅读minimal reproducible example。
df.head()有时对于 Pandas 的问题就足够了。