从具有 dtype =object 的列中查找唯一值

【问题标题】：To find a unique from a column with dtype =object从具有 dtype =object 的列中查找唯一值
【发布时间】：2020-02-24 12:24:44
【问题描述】：

样本数据：

test_Unique 是输出文件，它给出了我不想要的 8,8 2 时间，因为我只想要唯一值并删除重复项，但 8,8 出现 2 时间。 6,7也一样

我的样本数据的 dtype 是样本数据所在的对象“字符串” 我的数据框 final_task 中的列名 final_Unique

8,8
6,7
7,7
7,6
2,12
12,3
3,4
4,12
12,12
14,14
1,1
1,12
12,2
2,2
2,4
6,8
8,8

我正在尝试的代码是这样的：

final_task['test_Unique']=final_task['final_Unique'].drop_duplicates()

但我没有得到完美的输出这是什么问题

【问题讨论】：

标签： python pandas numpy dataframe data-science

【解决方案1】：

您可以遍历每一行，然后拆分字符串，然后找到唯一的并再次加入它们。然后你可以在新系列上运行drop_duplicates()。

import pandas as pd

df = pd.read_csv("final_task.csv")

df['final_Unique'].apply(lambda x: ",".join(map(str,sorted(map(int,x.split(',')))))).drop_duplicates()

【讨论】：

我必须得到 8,8 作为一对而不是 8
@Quicklearner 我误解了你的问题。无论如何，我有一个更新的答案。请检查。
Series([], Name: new_values, dtype: object) 我得到了这个，在我的值和新值列中都没有..
@Quicklearner 我不确定你做错了什么。可以分享一下快照吗？
@Quicklearner 也复制粘贴我的整个代码，并分享响应？