【发布时间】:2018-11-27 13:43:51
【问题描述】:
我正在尝试遍历一些文件并使用 pandas 跳过每个文件中标题之前的行。所有文件都采用相同的数据格式,除了有些文件在标题之前要跳过的行数不同。当一些文件比其他文件有更多的行要跳过时,有没有办法循环文件并从每个文件的标题开始?
例如, 有些文件需要这个:
f = pd.read_csv(fname,skiprows = 7,parse_dates=[0])
有些人要求这样做:
f = pd.read_csv(fname,skiprows = 15, parse_dates=[0])
这是我在文件中循环的代码块:
for name,ID in stations:
path = str(ID)+'/*.csv'
for fname in glob.glob(path):
print(fname)
f = pd.read_csv(fname,skiprows=15,parse_dates=[0]) #could also skip 7 depending on file
ws = f['Wind Spd (km/h)']*0.27778 #convert to m/s from km/h
dt = f['Date/Time']
【问题讨论】:
-
如何知道何时到达标题?标题上方的行总是空的吗?
-
是的,标题上方有几行空行,但空行数也因文件而异。我知道当标题的第一个字段以日期/时间开头时我已经到达标题