【发布时间】:2019-11-30 00:34:12
【问题描述】:
我有一个带有字母数字 ID 的 DataFrame 列 - 一些数字,一些字母,一些两者兼而有之。我正在使用 read_csv 读取数据,并希望将此列的所有值作为字符串读取。我无法更改基础数据中的值。
我已尝试将列的 dtype 设置为对象
df = pd.read_csv(filename, dtype = {col: object})
我还尝试使用转换器将列中的所有值更改为字符串。
df = pd.read_csv(filename, converters = {i: str for i in col})
但是,我仍然会得到一些非字符串数字 (12345) 和一些字符串数字 ('12345'),这会打乱我的聚合。
有什么建议吗?谢谢!
【问题讨论】:
-
您可能会发现回复this question 很有帮助。
-
df = pd.read_csv(filename, dtype = {'col': object}) 。我猜你错过了覆盖 col 的单个引号。请在您的代码中检查它。
-
col 是带有列名的变量,而不是列名。