【问题标题】:How to remove non-numeric data from numerical data?如何从数值数据中删除非数值数据?
【发布时间】:2020-08-03 12:19:14
【问题描述】:

我想从数值数据中删除非数值数据。我的数据框有 720000 行和 11 列,并且有一列包含这种类型的数据

id1080784

id0889885

id0857912

id3744273

id0232939 .....

我想从所有这些行中删除“id”字样。请仅用 Python 分享您的建议。

谢谢!

【问题讨论】:

  • 我们没有看到代码,所以我想我只能提及您可以执行的方法。您可以使用str 数据类型的replace 方法,例如string.replace("id", ""),或者您可以使用字符串的索引(例如string[2:])对字符串进行切片。然后可以将值的数据类型从str转换为int
  • 是来自 CSV 文件的输入吗?你想要什么输出 - 一个熊猫数据框?你试过什么?尝试str.slicestr.replacestr.extract,并检查guide on working with text data in pandas

标签: python file csv dataframe sorting


【解决方案1】:

一种方法是您可以使用 str 替换。只需将 'id' 替换为空即可。

import pandas as pd
col = pd.DataFrame(['id1080784', 'id0889885', 'id0857912', 'id3744273'])
col[0] = col[0].str.replace('id','')

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2019-04-05
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多