从包含一对整数的列表中删除重复元素的复杂性答案

【问题标题】：complexity of removing the duplicate element from a list which contain a pair of integer从包含一对整数的列表中删除重复元素的复杂性
【发布时间】：2021-06-02 09:30:57
【问题描述】：

我有一个包含成对整数示例的列表 -> [{1,2},{2,3},{2,1}]

我想从中删除重复的元素，就像 (1,2) 和 (2,1) 一样。

这是我的代码 ->

class Pair<t1,t2>
{
    int i, j;
    Pair(int i,int j){
        this.i=i;
        this.j=j;
    }

}

public class My 
{
    public static void main(String[] args) {
        Pair p;
        List<Pair<Integer,Integer>> src = Arrays.asList(new Pair(1,2), 
            new Pair(2,3), new Pair(2,1),new Pair(1,2));
        HashSet<String> dest  = new HashSet();

        for(int i=0; i < src.size(); i++) {
            p=src.get(i);
            if(dest.contains(p.j+" "+p.i)) {
                System.out.println("duplicacy");
            }  
            else {
                dest.add(p.i+" "+p.j);
            }
         
        }
        System.out.println("set is = "+dest);
     
        List<Pair<Integer,Integer>> ans=new ArrayList();
        String temp;
        int i,j;
        Iterator<String> it=dest.iterator();
        while(it.hasNext()) 
        {
            temp=it.next();
            i=Integer.parseInt(temp.substring(0,temp.indexOf(' ')));
            j=Integer.parseInt(temp.substring(temp.indexOf(' 
               ')+1,temp.length()));
            ans.add(new Pair(i,j));
         }
    
         for(Pair i_p:ans) {
             System.out.println("Pair = "+i_p.i+" , "+i_p.j);
         }

     }//end of main method
 }//end of class My

在这里，我首先将 2 个整数转换为单个字符串，然后将其插入哈希集中。有人可以告诉我上述代码的性能和时间复杂度吗？

【问题讨论】：

t1 和 t2 什么都不做。你的对总是存储整数。因此，您可以删除这些类型参数，并且相当多的声明会更短
@Michael 但是性能和时间复杂度是多少？

标签： java

【解决方案1】：

由于HashSet 对contains 方法使用O(1)，您的时间复杂度为3N+c，其中N 是输入对的大小，c 是恒定的。所以总的时间复杂度是O(N)。但是，您可以通过避免不必要的循环来改进您的代码。

您的空间复杂度也是3N+c，其顺序为 O(N)。但是，您也可以改进这一点。

我建议扩展你的 pair 类以包含一个 equal 方法。

class Pair<t1,t2>
{
    int i, j;
    Pair(int i,int j){
        this.i=i;
        this.j=j;
    }

    public int getI() { return i;}
    public int getJ() { return j;}
    
   // Overriding equals() to compare two Complex objects
    @Override
    public boolean equals(Object o) {
  
        // If the object is compared with itself then return true  
        if (o == this) {
            return true;
        }

        Pair c = (Pair) o;
        if( (i==c.getI() && j==c.getJ() ) ||
            (i==c.getJ() && j==c.getI() ) ) {
             return true;
         }else {
            return false;
         }

}

【讨论】：

【解决方案2】：

快速回顾：

设置： set 接口扩展了集合接口。在一个集合中，不允许重复。集合中的每个元素都必须是唯一的。

hashset: 是使用哈希表实现的。元素没有顺序。 add、remove 和 contains 方法具有恒定的时间复杂度 O(1)。

要回答您的问题，请记住，我们只会关注任何操作中最昂贵的操作，这意味着如果我们的代码的某些部分具有 o(n) 的时间复杂度和另一个 o(n^ 2) 然后我们会选择 o(n^2) 而不是 o(n) ，因为它是我们担心的最昂贵的。

首先，让我们谈谈空间复杂度，因为它很容易发现，从您的代码中，您可以使用三个变量来存储更大的数据：

源代码
目的地
回答

第一个基本上具有 s(n) n 的空间复杂度，它是未过滤数据的原始大小（不是唯一的）。在上面 s(4) = 4 的示例中，注意：这意味着 4 * 您正在使用的数据类型大小，例如，如果您要存储整数列表，您会说 s(4(int)) = 4 *(4bytes) = 16bytes 空间。

与上面相同的类比之后的第二个意味着我们有“src”的大小，“减去重复项” s(n) = 4 - 2(duplicates) = 2*(datatype size in bytes/bits)

第三个基本上只是成对存储来自“dest”的值，所以我们应该有基本相同的大小但数据类型不同。

这只是空间复杂度的基本转换，因此按照我们的规则，我们将保留最大的尺寸。所以，我们的空间复杂度是 s(n*(datatype size))，直接说 s(n) 是安全的。

对于时间复杂度，遵循相同的规则，我们需要在时间方面最昂贵的操作，这就是在“src”上执行的 for 循环，这是我们在这种情况下正在处理的任何数据的大小 4 ，所以我们可以说我们的时间复杂度是 o(n)。

算法总结：

空间复杂度：s(n)

时间复杂度：o(n)

性能相对平均。

【讨论】：

实际上我首先将整数对转换为字符串，然后将它们存储到哈希集中。现在我怀疑这里发生碰撞的机会更高，这会增加从 O(n) 到其他东西的时间复杂度。
不，转换为String实际上不会增加时间复杂度。此外，您关心的是您自己的算法，而不是一些低级的预先编写的算法。这就像说您担心执行 2+2 需要多长时间……我的意思是，如果您正在设计自己的编译器，您可以对此有所限制，哈哈。