【发布时间】:2017-04-24 20:47:43
【问题描述】:
我想导入路径结构化的 csv 文件并输出为一个 CSV。我的代码只适用于路径和手动输入的 csv 文件。
import csv
import pandas as pd
import numpy as np
import glob
cols = ['Date', 'Time', 'Duration', 'IP', 'Request']
pd.DataFrame(columns=cols).to_csv('out9.csv', index=False, sep=';')
for df in pd.read_csv('query.csv', sep='\s', header=None, chunksize=6):
df.reset_index(drop=True, inplace=True)
df.fillna('', inplace=True)
d = pd.DataFrame([df.loc[3,0], df.loc[3,1], ' '.join(df.loc[3,4:8]), ' '.join(df.loc[4,4:6]), ' '.join(df.loc[5,4:])])
d.T.to_csv('out.csv', index=False, header=False, mode='a', sep=';')
我知道有一些主题如何阅读许多 csv 文件,但不幸的是,在我的情况下没有帮助。
我想了解一下:
: C\Desktop\Files\*.csv
有关 csv 文件的信息: 所有都构建相同,即没有标题,相同的结构。 我想在我的代码开始时将所有内容都放在一个文件夹中读取并再次格式化。
因此,如果可以尽可能少地更改代码,我只会读取几个 csv,而不是这些 'query.csv'
谢谢!
【问题讨论】:
标签: python csv pandas data-cleaning