【发布时间】:2020-02-24 22:04:44
【问题描述】:
我在 .csv 文件中有一个数据集,我正在尝试提取并命名它的列。我使用以下代码:
data_name = 'housing.csv'
column_names = ['CRIM', 'ZN', 'INDUS', 'CHAS', 'NOX',
'RM', 'AGE', 'DIS', 'RAD', 'TAX', 'PTRATIO',
'LSTAT', 'MEDV']
data = pd.read_csv(data_name, names=column_names, error_bad_lines=False,
header=None)
问题在于它将标题分配给了错误的列。只有最后一列被重命名并添加其他列,并填充 NaN 值。我也尝试过使用rename 得到类似的结果。这是print(data.head()) 的样子:
CRIM ZN ... LSTAT MEDV
0 0.00632 18.00 2.310 0 0.5380 6.5750 65... NaN ... NaN NaN
1 0.02731 0.00 7.070 0 0.4690 6.4210 78... NaN ... NaN NaN
2 0.02729 0.00 7.070 0 0.4690 7.1850 61... NaN ... NaN NaN
3 0.03237 0.00 2.180 0 0.4580 6.9980 45... NaN ... NaN NaN
4 0.06905 0.00 2.180 0 0.4580 7.1470 54... NaN ... NaN NaN
关于如何解决这个问题的任何想法?
【问题讨论】: