【发布时间】:2020-07-07 15:39:28
【问题描述】:
是否有一个内置的 linq 方法可以用来确定两个序列是否包含相同的项目,而不考虑顺序?
例如:
{1, 2, 3} == {2, 1, 3}
{1, 2, 3} != {2, 1, 3, 4}
{1, 2, 3} != {1, 2, 4}
你有 SequenceEquals,但是我必须先订购两个序列,不是吗?
【问题讨论】:
是否有一个内置的 linq 方法可以用来确定两个序列是否包含相同的项目,而不考虑顺序?
例如:
{1, 2, 3} == {2, 1, 3}
{1, 2, 3} != {2, 1, 3, 4}
{1, 2, 3} != {1, 2, 4}
你有 SequenceEquals,但是我必须先订购两个序列,不是吗?
【问题讨论】:
有很多方法。假设 A 和 B 是 IEnumerable。
!A.Except(B).Any() && !B.Except(A).Any()
A.Count() == B.Count() && A.Intersect(B).Count() == B.Count()
etc
【讨论】:
如果您不关心重复项(即您认为{1, 2, 3} 等于{1, 2, 3, 2}),那么:
new HashSet<int>(A).SetEquals(B)
(或者任何类型的元素类型,而不是int)。
否则:
public static bool SequenceEqualUnordered<T>(IEnumerable<T> first, IEnumerable<T> second)
{
if (first == null)
return second == null; // or throw if that's more appropriate to your use.
if (second == null)
return false; // likewise.
var dict = new Dictionary<T, int>(); // You could provide a IEqualityComparer<T> here if desired.
foreach(T element in first)
{
int count;
dict.TryGetValue(element, out count);
dict[element] = count + 1;
}
foreach(T element in second)
{
int count;
if (!dict.TryGetValue(element, out count))
return false;
else if (--count == 0)
dict.Remove(element);
else
dict[element] = count;
}
return dict.Count == 0;
}
记录第一个序列中的每个元素,然后对照它检查第二个元素。如果第二个序列中有一个太多,则可以返回 false,否则如果计数字典中没有任何内容,则它们是相等的,如果还剩下任何元素,则返回 false。
与使用OrderBy() 后跟O(n) 比较的两种O(n log n) 不同,您有一个O(n) 操作来构建计数集,以及一个O(n) 检查反对它。
【讨论】:
有两个 IEnumerables(A 和 B):
bool equal = (A.Count() == B.Count() && (!A.Except(B).Any() || !B.Except(A).Any()))
我认为这比 except(A).Count 更好,因为不会评估整个 Excep。只要在例外中找到一个元素,它就会停止。使用 Count,评估整个 except。 最重要的是,我们可以通过首先检查 Count 属性来避免评估这些代价高昂的 except。如果计数不相等,那么我们检查例外。
【讨论】:
Except() 之间的|| 应该是&&,正如answer 所建议的那样。否则,以下情况也将成立:{1,2,3} == {1,2,1}。我不确定它是否正确——至少对我来说不是:)。
试试 HashSet 类:
var enumA = new[] { 1, 2, 3, 4 };
var enumB = new[] { 4, 3, 1, 2 };
var hashSet = new HashSet<int>(enumA);
hashSet.SymmetricExceptWith(enumB);
Console.WriteLine(hashSet.Count == 0); //true => equal
但这只有在值不同的情况下才能正常工作。
例如
var enumA = new[] { 1, 1, 1, 2 };
var enumB = new[] { 1, 2, 2, 2 };
也被认为与上述方法“相等”。
【讨论】:
return hashSet.SetEquals(enumB);
按照您的示例,您可以将两个 IEnumerable 都设为 List 类型,然后使用 SequenceEqual 作为下面的示例:
var first = Enumerable.Range(1, 3);
var second = Enumerable.Range(1, 3);
var areTheyEqual = first.ToList().SequenceEqual(second.ToList());
if (areTheyEqual)
{ /* do something... */}
【讨论】:
我这样做是为了将新项目合并到一个没有重复的集合中, 它需要两个集合并返回所有项目,没有任何重复
List<Campaign> nonMatching = (from n in newCampaigns
where !(from e in Existing select e.Id).Contains<int>(n.Id)
select n).ToList<Campaign>();
现在通过删除 !对于包含语句
List<Campaign> nonMatching = (from n in newCampaigns
where (from e in Existing select e.Id).Contains<int>(n.Id)
select n).ToList<Campaign>();
它会返回重复的
【讨论】:
为了比较两个对象中的数据,我简单地用了这个
A.Except(B).Any() || B.Except(A).Any()
【讨论】:
!A.Except(B).Any() && !B.Except(A).Any(),但看起来更干净一些。 ?
!A.Except(B).Any() && !B.Except(A).Any() 不等于 A.Except(B).Any() || B.Except(A).Any()。这是逆逻辑。前者检查逐项等效性;后者检查逐项不等价。
我认为对序列进行排序是实现这一目标的最快方式。
【讨论】:
如果你真的只是在测试是否有重复,那么 leppie 的建议应该有效:
if (A.Except(B).Count == 0 && B.Except(A).Count == 0) {...}
但如果你只需要得到一个没有重复的 IEnumerable:
var result = A.Union(B).Distinct();
【讨论】: