【问题标题】:Using LINQ to find duplicates across multiple properties使用 LINQ 跨多个属性查找重复项
【发布时间】:2011-08-01 13:58:08
【问题描述】:

给定一个具有以下定义的类:

public class MyTestClass
{
    public int ValueA { get; set; }
    public int ValueB { get; set; }
}

如何在 MyTestClass[] 数组中找到重复值?

例如,

MyTestClass[] items = new MyTestClass[3];
items[0] = new MyTestClass { ValueA = 1, ValueB = 1 };
items[1] = new MyTestClass { ValueA = 0, ValueB = 1 };
items[2] = new MyTestClass { ValueA = 1, ValueB = 1 };

包含重复项,因为有两个 MyTestClass 对象,其中 ValueA ValueB 都 = 1

【问题讨论】:

    标签: c# .net linq duplicate-removal


    【解决方案1】:

    您可以通过按 ValueA 和 ValueB 对元素进行分组来查找重复项。 之后对它们进行计数,您会发现哪些是重复的。

    这就是你隔离受骗者的方法:

    var duplicates = items.GroupBy(i => new {i.ValueA, i.ValueB})
      .Where(g => g.Count() > 1)
      .Select(g => g.Key);
    

    【讨论】:

    • 正是我想要的!你赢得了互联网。非常感谢。
    【解决方案2】:

    您可以同时使用 Jon Skeet 的 DistinctByExcept 来查找重复项。他对DistinctBy的解释见this Response

    MyTestClass[] items = new MyTestClass[3];
    items[0] = new MyTestClass { ValueA = 1, ValueB = 1 };
    items[1] = new MyTestClass { ValueA = 0, ValueB = 1 };
    items[2] = new MyTestClass { ValueA = 1, ValueB = 1 };
    
    MyTestClass [] distinctItems = items.DistinctBy(p => new {p.ValueA, p.ValueB}).ToArray();
    MyTestClass [] duplicates = items.Except(distinctItems).ToArray();
    

    它只会返回一个项目,而不是两个重复项。

    【讨论】:

      【解决方案3】:

      MyTestClass 应该实现 Equals 方法。

      public bool Equals(MyTestClass x, MyTestClass y)
      {
          if (Object.ReferenceEquals(x, y)) return true;
      
          if (Object.ReferenceEquals(x, null) ||
              Object.ReferenceEquals(y, null))
                  return false;
      
              return x.ValueA == y.ValueA && y.ValueB == y.ValueB;
      }
      

      这里有一个good article

      之后,您可以使用“Distinct”方法获得 MyTestClass 的“干净”列表。

      【讨论】:

      • 如果 Distinct 可以工作,那么您需要做的不仅仅是实现 Equals 方法。您应该实现 IEquatable 接口并确保正确实现 GetHashCode 和 object equals。
      • 对,我的错 ;-) 无论如何,这不是太多的工作......而且它在许多情况下都很有趣 ;-)
      猜你喜欢
      • 2015-09-15
      • 2011-12-30
      • 1970-01-01
      • 2012-10-13
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2013-03-14
      • 2013-03-22
      相关资源
      最近更新 更多