【发布时间】:2020-11-01 20:05:33
【问题描述】:
我有一个 excel 文件中的推文 ID 列表(没有值)
ID
1258125182063050753
1233371388620263429
1237667024618258432
1225204912755179521
nan
nan
当我尝试在 Pandas 数据报中加载 excel 文件时,我将字符串列转换为干扰使用
df['ID']=df['ID'].apply(np.int64)
我得到的值是
1258125182063050752
1233371388620263424
1237667024618258432
1225204912755179520
0
0
字符串到整数的转换会改变数值。我该如何解决这个问题?
【问题讨论】:
-
您的意思是将零 (0) 改回 NaN 吗?检查这个:[Python Pandas 将多列零替换为 Nan] (stackoverflow.com/questions/45416684/…)
-
@naccode no,我担心的是 1258125182063050753 转换后变成 1258125182063050752
-
为什么要转换成整数?您不必对这些数字进行计算,因此请将它们保存为字符串。
-
顺便说一句:你在转换之前检查过 Pandas 中的值吗?也许你已经有错误的数据。您是直接从 Excel 加载还是从 CSV 加载?您是否在文本编辑器中检查了 CSV 以查看文件中的值是否正确?
标签: python python-3.x pandas tweepy