【问题标题】:Effectively to find the median value of a random sequence有效地找到随机序列的中值
【发布时间】:2025-12-07 08:25:02
【问题描述】:

数字是随机生成并传递给方法的。编写一个程序,在生成新值时查找并保持中间值。

堆大小可以相等,或者下面的堆有一个额外的。

private Comparator<Integer> maxHeapComparator, minHeapComparator;
private PriorityQueue<Integer> maxHeap, minHeap;

public void addNewNumber(int randomNumber) {
  if (maxHeap.size() == minHeap.size()) {
    if ((minHeap.peek() != null) && randomNumber > minHeap.peek()) {
      maxHeap.offer(minHeap.poll());
      minHeap.offer(randomNumber);
    } else {
      maxHeap.offer(randomNumber);
    }
  }
  else {  // why the following block is correct? 
    // I think it may create unbalanced heap size
    if(randomNumber < maxHeap.peek()) {
      minHeap.offer(maxHeap.poll());
      maxHeap.offer(randomNumber);
    }
    else {
      minHeap.offer(randomNumber);
    }
  }
}

public static double getMedian() {
  if (maxHeap.isEmpty()) return minHeap.peek();
  else if (minHeap.isEmpty()) return maxHeap.peek();

  if (maxHeap.size() == minHeap.size()) {
    return (minHeap.peek() + maxHeap.peek()) / 2;
  } else if (maxHeap.size() > minHeap.size()) {
    return maxHeap.peek();
  } else {
    return minHeap.peek();
  }
}

假设解决方案是正确的,那么我不明白为什么代码块(参见我的 cmets)可以保持堆大小平衡。也就是说,两个堆的大小差为0或1。

Let us see an example, given a sequence 1, 2, 3, 4, 5
The first random number is **1**
    max-heap: 1
    min-heap:

The second random number is **2**
    max-heap: 1
    min-heap: 2

The third random number is **3**
    max-heap: 1 2
    min-heap: 3 4

The fourth random number is **4**
    max-heap: 1 2 3
    min-heap: 4 5

谢谢

【问题讨论】:

  • Eww 行号。还要为语法高亮标记正确的语言。
  • 这是作业吗?如果是这样,请相应地标记。
  • “写一个程序到..” 算了,这是你的家庭作业,不是我们的。

标签: java algorithm


【解决方案1】:

按照给定的顺序运行后,

max-heap : 1, 2, 3
min-heap : 4, 5

因为 max-heap 大小 > min-heap 它返回 3 作为中位数。

max-heap 大约存储左半部分元素,min-heap 大约存储右半部分序列。

此代码偏向于最大堆的左半部分。

我不明白为什么这段代码不正确。

【讨论】: