【问题标题】:Find duplicates within subgroups with conditions在具有条件的子组中查找重复项
【发布时间】:2018-06-04 17:53:47
【问题描述】:

我无法计算特定值出现在组的子组中的实例。

数据示例如下:

GROUP   ID  DATA  
1       1   Main St    
1       1   1st St
1       2   Main St
1       2   
2       1   Main St
2       1   Main St
2       1   
2       2   1st St
2       2   

上下文: 我正在解决我的数据中的重复项,在某些情况下,同一个人有两个单独的 ID 和记录。我对可能的重复项进行了自动检查,这些重复项由 GROUP 字段标记; ID 字段是个人 ID 号。地址信息是挑选重复项的一种非常简单的方法。

我需要写一些东西来做以下事情:

对于每个 GROUP 编号,查看其中的所有唯一 ID。对于组内的每个唯一 ID,查看 DATA 字段中的地址是否出现在组内的任何其他唯一 ID 中,但不是该特定行中的 ID 号。任何匹配项都应标记为 1 / TRUE / 等。

我写了一个 COUNTIFS 公式,它可以得到大部分的结果,但它不排除公式所在的行。

是 COUNTIFS(A:A,A2, B:B,"&", C:C,C2)

对于第一行,它应该产生一个 1,b/c Main St 出现在 Group1 ID1 和 Group1 ID2 中。我不能让它忽略 Group1 ID1 行,我被公式给了一个 2 的结果,b/c Main Street 在 Group1 中出现了两次。

感谢任何帮助。

谢谢!

【问题讨论】:

    标签: arrays excel if-statement countif


    【解决方案1】:

    在单元格 D2 中使用此 COUNTIFS 公式并向下复制:

    =COUNTIFS(A$2:A2,A2,C$2:C2,C2)>1
    

    适当的重复将被标记为TRUE

    【讨论】:

    • 出于好奇,我尝试了这个(漂亮的把戏)。但是,我认为我得到了假阴性?第 2 组的数据中有两个空白,第二个空白不应该也评估为真吗?
    • @LuxClaridge COUNTIFS 将空白单元格评估为0,并且由于数据中没有其他 0,因此它被评估为假。如果您希望空白算作重复数据,则必须添加一个额外的条件。
    • 我注意到它将空白视为 0,我只是假设它会计数为零。那好吧。这绝对是我要放在后兜里的东西。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2015-12-18
    • 2020-03-31
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2017-04-15
    相关资源
    最近更新 更多