【发布时间】:2015-10-27 19:33:30
【问题描述】:
例如,如果我想考虑花卉种类、花瓣数量、发芽时间和用户ID,则用户ID 将有一个连字符。所以在我的数据分析中,我不想使用它。我知道我可以对其进行硬编码,但我想这样当我输入任何数据集时,它会自动删除带有non-numeric 输入的列。
编辑:不清楚的问题。我正在使用熊猫从 csv 文件中读取数据。
例子:
Species NPetals GermTime UserID
1 R. G 5 4 65-78
2 R. F 5 3 65-81
我想从dataset 中删除UserID 和Species 列。
【问题讨论】:
-
你的问题很不清楚。首先,您的数据是什么格式的? SQL 数据库? CSV? Excel?熊猫数据框?请参阅How to Ask 页面以获得澄清此问题的帮助。
-
对不起,我已经澄清了一些问题。
-
那么
del df['Species']和del df['UserID']有什么问题? -
这对于这个特定的数据集来说很好,但我确实想让它更智能。如果我使用另一个数据集,它应该会自动删除非数字列。我不想每次更改数据集时都更改代码。
-
所以设置一个小
if循环测试每列的dtype...
标签: python python-2.7 pandas