【问题标题】:How to filter only duplicate comments如何仅过滤重复的评论
【发布时间】:2021-06-03 18:42:21
【问题描述】:

嗨 :) 有两列:情绪和评论。如何仅过滤数据集中重复的 cmets?谢谢四位的帮助:)

【问题讨论】:

    标签: python pandas duplicates comments


    【解决方案1】:

    这取决于您希望仅输出重复记录所使用的列。

    示例 1 - 基于名为 df 的数据框中的所有列

    duplicates = df[df.duplicated(keep=False)] #False means retaining all duplicates
    

    示例 2 - 基于某个或多个列

    duplicate = dictionary_df[dictionary_df[0].duplicated(keep=False)]#This is on the first column
    

    【讨论】:

      【解决方案2】:

      你可以使用pandas.DataFrame.duplicated

      df[df.comment.duplicated(False)]
      

      【讨论】:

        猜你喜欢
        • 2016-09-09
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        相关资源
        最近更新 更多