【发布时间】:2021-06-03 18:42:21
【问题描述】:
嗨 :) 有两列:情绪和评论。如何仅过滤数据集中重复的 cmets?谢谢四位的帮助:)
【问题讨论】:
标签: python pandas duplicates comments
嗨 :) 有两列:情绪和评论。如何仅过滤数据集中重复的 cmets?谢谢四位的帮助:)
【问题讨论】:
标签: python pandas duplicates comments
这取决于您希望仅输出重复记录所使用的列。
示例 1 - 基于名为 df 的数据框中的所有列
duplicates = df[df.duplicated(keep=False)] #False means retaining all duplicates
示例 2 - 基于某个或多个列
duplicate = dictionary_df[dictionary_df[0].duplicated(keep=False)]#This is on the first column
【讨论】:
你可以使用pandas.DataFrame.duplicated
df[df.comment.duplicated(False)]
【讨论】: