【问题标题】:To find a unique from a column with dtype =object从具有 dtype =object 的列中查找唯一值
【发布时间】:2020-02-24 12:24:44
【问题描述】:

样本数据:


test_Unique 是输出文件,它给出了我不想要的 8,8 2 时间,因为我只想要唯一值并删除重复项,但 8,8 出现 2 时间。 6,7也一样

我的样本数据的 dtype 是样本数据所在的对象“字符串” 我的数据框 final_task 中的列名 final_Unique

8,8
6,7
7,7
7,6
2,12
12,3
3,4
4,12
12,12
14,14
1,1
1,12
12,2
2,2
2,4
6,8
8,8

我正在尝试的代码是这样的:

final_task['test_Unique']=final_task['final_Unique'].drop_duplicates()

但我没有得到完美的输出这是什么问题

【问题讨论】:

    标签: python pandas numpy dataframe data-science


    【解决方案1】:

    您可以遍历每一行,然后拆分字符串,然后找到唯一的并再次加入它们。然后你可以在新系列上运行drop_duplicates()

    import pandas as pd
    
    df = pd.read_csv("final_task.csv")
    
    df['final_Unique'].apply(lambda x: ",".join(map(str,sorted(map(int,x.split(',')))))).drop_duplicates()
    

    【讨论】:

    • 我必须得到 8,8 作为一对而不是 8
    • @Quicklearner 我误解了你的问题。无论如何,我有一个更新的答案。请检查。
    • Series([], Name: new_values, dtype: object) 我得到了这个,在我的值和新值列中都没有..
    • @Quicklearner 我不确定你做错了什么。可以分享一下快照吗?
    • @Quicklearner 也复制粘贴我的整个代码,并分享响应?
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2011-04-22
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2023-03-28
    • 1970-01-01
    相关资源
    最近更新 更多