【发布时间】:2020-04-17 14:05:19
【问题描述】:
我正在寻找将这些数据清理为可以作为 pandas 数据框输入以进行进一步分析的最佳方法。目前前几行数据的结构如下(有几千行数据):
4 0 1. 1 37.0 10.000 0 3 18. 40.0 7 4 0. 0. 1.
5 0 1. 0 27.0 4.000 0 4 14. 20.0 6 4 0. 0. 1.
11 0 1. 0 32.0 15.000 1 1 12. 12.5 1 4 0. 0. 1.
16 0 1. 1 57.0 15.000 1 5 18. 12.5 6 5 0. 0. 1.
23 0 1. 1 22.0 0.750 0 2 17. 7.5 6 3 0. 0. 1.
29 0 1. 0 32.0 1.500 0 2 17. 7.5 5 5 0. 0. 1.
44 0 1. 0 22.0 0.750 0 2 12. 12.5 1 3 0. 0. 1.
45 0 1. 1 57.0 15.000 1 2 14. 20.0 4 4 0. 0. 1.
47 0 1. 0 32.0 15.000 1 4 16. 20.0 1 2 0. 0. 1.
49 0 1. 1 22.0 1.500 0 4 14. 12.5 4 5 0. 0. 1.
50 0 1. 1 37.0 15.000 1 2 20. 20.0 7 2 0. 0. 1.
55 0 1. 1 27.0 4.000 1 4 18. 12.5 6 4 0. 0. 1.
各栏目如下:
标识符,未使用,常量,z1,z2,z3,z4,z5,z6,未使用,z7, z8,yPT,没用过,没用过
因此,并非数据中的每一列都很重要,但是如果可以将其转换为 pandas 数据框,我可以轻松处理这一点。
【问题讨论】:
-
你能把那些有标题的文件做成一个csv文件吗?
标签: python pandas machine-learning deep-learning data-science