【发布时间】:2018-05-31 16:02:16
【问题描述】:
我运行 df.dtypes 并为某些列获取“对象”类型。这是否意味着 Pandas 无法分辨列类型是什么?还是可以在将这种类型保留在数据框中进行分析? 它是清理数据的一部分以确保数据框中没有类型“对象”吗?
【问题讨论】:
-
在 dtypes 上查看 pandas docs
标签: pandas
我运行 df.dtypes 并为某些列获取“对象”类型。这是否意味着 Pandas 无法分辨列类型是什么?还是可以在将这种类型保留在数据框中进行分析? 它是清理数据的一部分以确保数据框中没有类型“对象”吗?
【问题讨论】:
标签: pandas
对象可以使用!你不需要删除它。 df.dtypes 告诉您 Numpy 已将该列描述为“对象”,它只是一个很可能是字符串类型的 Python 对象。
【讨论】:
根据我的经验,当该列中的项目大小不匹配时,type object 是默认的对象类型。例如,一列可以包含多种大小的字符串,因此它不是统一的,python 将其默认为通用对象。
通常最好继续清理过程,这样您就可以更好地利用内存/拥有统一的对象类型。
希望这会有所帮助!
【讨论】: