【问题标题】:Maximum distinct elements after removing k elements删除 k 个元素后的最大不同元素
【发布时间】:2020-12-28 15:49:01
【问题描述】:

这是 geeksforgeeks 问题的链接 https://practice.geeksforgeeks.org/problems/maximum-distinct-elements-after-removing-k-elements/0

这是我的代码-

import collections
import heapq
def maxoccur(arr,k):
   c = 0
   d = collections.Counter(arr)
   heap = [(value,key) for key,value in d.items()]
   heapq.heapify(heap)
   while(heap):
     x = heapq.heappop(heap)

     if x[0] == 1:
        c+=1
     elif x[0]>1 and k>0:
        k-=1
        y = x[0]-1
        heapq.heappush(heap,(y,x[1]))
     elif k<=0:
        break
    if k == 0:
        while(heap):
            x = heapq.heappop(heap)
            if x[0] == 1:
               c+=1
    elif k>0:
       c-=k
    
    return c

我的代码有什么问题我在这个测试用例中得到了错误的答案-

输入: 84 47 28 26 24 26 17 13 10 2 3 8 21 20 24 17 1 7 23 17 12 9 28 10 3 21 3 14 8 26 30 13 13 19 30 28 14 17 2 23 10 4 22 30 15 8 9 15 6 2 21 27 4 3 21 17 2 16 16 15 28 27 6 17 10 14 18 25 16 13 16 15 28 15 15 4 21 8 19 7 9 9 25

它的正确输出是: 27

您的代码的输出是: 25

【问题讨论】:

    标签: python-3.x algorithm data-structures hash heap


    【解决方案1】:

    更简单的方法是基于事实,即我们首先可以删除出现次数 > 1 的任何项目而不更改不同值计数,然后删除一些其余的 - 现在不同值计数变得更少。

    def maxoccur(arr,k):
        lena = len(arr)
        lens = len(set(arr))
        excess = lena - lens
        return lens if excess >= k else max(0, lena - k)
    

    作为作者代码转换的旧答案

    请注意,堆是 minheap,我将其设为 quasi-maxheap,并对计数器取反。 然后我们只做 k 个(如果可能的话)递减计数器的操作,然后在堆中寻找其余的。

    堆中根本不需要源值,但我懒得改代码。

    import collections
    import heapq
    def maxoccur(arr,k):
        d = collections.Counter(arr)
        heap = [(-value, key) for key,value in d.items()]
        heapq.heapify(heap)
        while (heap) and (k > 0):
            k -= 1
            x = heapq.heappop(heap)
            if x[0] < -1:
                heapq.heappush(heap,(x[0]+1,x[1]))
        return len(heap)
    
    k = 47
    arr = [int(i) for i in '28 26 24 26 17 13 10 2 3 8 21 20 24 17 1 7 23 17 12 9 28 10 3 21 3 14 8 26 30 13 13 19 30 28 14 17 2 23 10 4 22 30 15 8 9 15 6 1 24 17 2 21 27 4 3 21 17 2 16 16 15 28 27 6 17 10 14 18 25 16 13 16 15 28 15 15 4 21 8 19 7 9 9 25'.split()]
    print(maxoccur(arr,k))
    
    arr = [5, 7, 5, 5, 1, 2, 2]
    k = 3
    print(maxoccur(arr,k))
    
    >>>
    27
    4
    

    【讨论】:

    • 好的,你的代码正在运行,但你能告诉我我的代码有什么问题吗?这将是很大的帮助谢谢你
    • @Pratyush Narain 提取最小计数器的逻辑太复杂了。您首先提取单个元素,减少多次出现的计数器-因此其中一些(较小的!!!)也变成了单个元素。所以我不确定减少更大的计数器是否正确。
    • 好的,我有一个疑问,我们想返回最大可能的不同出现。我们正在制作maxheap。假设我们有 k=1,我们的数组是 5,5,5,2,2,1,所以根据您的代码,我们将首先弹出 5,K 将变为 0,我们将最终数组为 5,5,2 ,2,1 只有一个不同的元素。但是我们可以得到 5,5,5,2,1 有 2 个不同的出现。我的逻辑正确吗?如果是,那我们为什么要使用最大堆?
    • 为了提供尽可能多的不同项目,我们需要“剪切”出现次数最多的项目(或仅所有计数器>1) - 此过程不会尽可能长时间地减少不同的计数
    • 好的,再一次,一步一步。数组 [5,5,5,2,2,1] 包含 3 个不同的值 1,2 和 5。清楚吗?
    猜你喜欢
    • 2021-12-31
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2021-06-04
    • 2019-08-13
    • 1970-01-01
    • 2015-10-06
    • 1970-01-01
    相关资源
    最近更新 更多