【发布时间】:2020-05-29 13:41:34
【问题描述】:
我创建了以下代码,它通过删除所有具有 NaN 值的行来读取并清理文件中的数据,并计算存在多少这样的行。计数部分运行得很好,但我无法保存我创建的没有空值行的新文件。如何保存这个 new_data 文件?
data = parse('PAAD.gct')
new_data = data.data_df.dropna(axis = 0, how ='any')
print("Old data frame length:", len(data.data_df), "\nNew data frame length:",
len(new_data), "\nNumber of rows with at least 1 NA value: ",
(len(data.data_df)-len(new_data)))
write(new_data , 'new_file.gct')
运行此代码时出现以下错误
AttributeError: 'DataFrame' object has no attribute 'data_df'
【问题讨论】:
-
什么是
data_df?如果它是一个pandas.DataFrame对象,不要在它前面加上data.。你可以用pandas.DataFrame.to_csv保存一个df。 -
如果我这样做了,我会得到一个错误
data_dfis not defined -
请分享整个错误信息,以及minimal reproducible example。
标签: python python-3.x numpy nan file-handling