【发布时间】:2019-09-08 03:22:34
【问题描述】:
我在 python 中有一个包含重复数据帧的列表。目标是完全删除这些重复的数据帧。这是一些代码:
import pandas as pd
import numpy as np
##Creating Dataframes
data1_1 =[[1,2018,80], [2,2018,70]]
data1_2 = [[1,2017,77], [3,2017,62]]
df1 = pd.DataFrame(data1_1, columns = ['ID', 'Year', 'Score'])
df2 = pd.DataFrame(data1_2, columns = ['ID', 'Year', 'Score'])
###Creating list with duplicates
all_df_list = [df1,df1,df1,df2,df2,df2]
想要的结果是这样的:
###Desired results
desired_list = [df1,df2]
有没有办法在 python 列表中删除任何重复的数据帧?
谢谢
【问题讨论】:
-
你想在列表中删除重复项还是作为数据框?
-
如果整个数据帧与列表中的另一个数据帧完全相同,我想删除它。
-
由于您有相同的列,因此从列表中的数据帧中创建一个大数据帧并像 Engineero 那样删除重复项是合乎逻辑的。但显然,你不希望这样。
-
如果数据相同,但索引顺序不同(即只是交换其中一个DataFrames的行)是否重复?
标签: python pandas dataframe duplicates