【问题标题】：What would cause an algorithm to have O(log n) complexity?什么会导致算法具有 O(log n) 复杂度？
【发布时间】：2012-02-27 12:02:27
【问题描述】：

我对大 O 的了解是有限的，当等式中出现对数项时，它会让我更加反感。

有人可以简单地向我解释一下O(log n) 算法是什么吗？对数从何而来？

当我试图解决这个中期练习问题时，这特别出现了：

令 X(1..n) 和 Y(1..n) 包含两个整数列表，每个列表都按非递减顺序排序。给出一个 O(log n) 时间的算法来找到所有 2n 个组合元素的中位数（或第 n 个最小整数）。例如，X = (4, 5, 7, 8, 9) 和 Y = (3, 5, 8, 9, 10)，那么 7 是组合列表的中位数 (3, 4, 5, 5, 7 , 8, 8, 9, 9, 10)。 [提示：使用二分查找的概念]

【问题讨论】：

O(log n) 可以看成是：如果你把问题大小加倍n，你的算法只需要多步数不变。
这个网站帮助我理解了大 O 表示法：recursive-design.com/blog/2010/12/07/…
我想知道为什么 7 是上面示例的中位数，fwiw 也可能是 8。不是很好的例子吗？
考虑 O(log(n)) 算法的一个好方法是，在每一步中，它们都会将问题的大小减少一半。以二分搜索为例 - 在每一步中，您检查搜索范围中间的值，将范围分成两半；之后，您从搜索范围中消除一半，另一半成为下一步的搜索范围。因此，在每一步中，您的搜索范围都会减半，因此算法的复杂度为 O(log(n))。（减少不一定是一半，可以是三分之一，25%，任何恒定百分比；一半是最常见的）
谢谢大家，解决以前的问题，很快就会解决这个问题，非常感谢您的回答！稍后会回来研究这个

标签： algorithm big-o time-complexity logarithm

【解决方案1】：

我不得不承认，当你第一次看到 O(log n) 算法时，这很奇怪……这个对数到底是从哪里来的？然而，事实证明，有几种不同的方法可以让日志项以大 O 表示法显示。以下是一些：

反复除以常数

取任意数n；比如说 16. 在得到小于或等于 1 的数之前，你可以将 n 除以多少次？对于 16，我们有这个

请注意，这最终需要四个步骤才能完成。有趣的是，我们也有 log₂ 16 = 4。嗯……那么 128 呢？

128 / 2 = 64
 64 / 2 = 32
 32 / 2 = 16
 16 / 2 = 8
  8 / 2 = 4
  4 / 2 = 2
  2 / 2 = 1

这需要七个步骤，并且 log₂ 128 = 7。这是巧合吗？没有！这是有充分理由的。假设我们将一个数 n 除以 2 i 次。然后我们得到数字 n / 2ⁱ。如果我们要求解 i 的值，该值最多为 1，我们得到

n / 2ⁱ ≤ 1

n ≤ 2ⁱ

log₂ n ≤ i

换句话说，如果我们选择一个整数 i 使得 i ≥ log₂ n，那么在将 n 除以 i 次后，我们将得到一个最多为 1 的值。最小的可以保证的 i 大约是 log₂ n，所以如果我们有一个算法除以 2 直到数字变得足够小，那么我们可以说它以 O(log n) 步结束.

一个重要的细节是，你将 n 除以什么常数并不重要（只要它大于一）；如果除以常数 k，则需要 log_k n 步才能达到 1。因此，任何将输入大小重复除以某个分数的算法都需要 O(log n) 次迭代才能终止。这些迭代可能会花费大量时间，因此净运行时间不必为 O(log n)，但步数将是对数。

那么这在哪里出现？一个经典的例子是 binary search，这是一种快速算法，用于在已排序的数组中搜索值。该算法的工作原理如下：

如果数组为空，则返回该元素不存在于数组中。
否则：
- 查看数组的中间元素。
- 如果它等于我们要查找的元素，则返回成功。
- 如果它大于我们要查找的元素：
  - 丢弃数组的后半部分。
  - 重复
- 如果它小于我们要查找的元素：
  - 丢弃数组的前半部分。
  - 重复

例如在数组中搜索5

1   3   5   7   9   11   13

我们先看看中间元素：

1   3   5   7   9   11   13
            ^

由于 7 > 5，并且由于数组已排序，我们知道数字 5 不能在数组的后半部分，所以我们可以丢弃它。这离开了

1   3   5

所以现在我们看这里的中间元素：

1   3   5
    ^

由于3

我们再看一下这个数组的中间：

        5
        ^

由于这正是我们正在寻找的数字，我们可以报告 5 确实在数组中。

那么效率如何？好吧，在每次迭代中，我们都会丢弃至少一半的剩余数组元素。一旦数组为空或者我们找到我们想要的值，算法就会停止。在最坏的情况下，元素不存在，所以我们一直将数组的大小减半，直到我们用完元素。这需要多长时间？好吧，由于我们一遍又一遍地把数组切成两半，我们最多会在 O(log n) 次迭代中完成，因为在运行之前我们不能将数组切成两半超过 O(log n) 次超出数组元素。

遵循 divide-and-conquer 的一般技术的算法（将问题分成几部分，解决这些部分，然后将问题重新组合在一起）出于同样的原因，它们中往往包含对数项 - 你不能将某些物体切割成 O(log n) 次以上。您可能希望将 merge sort 视为一个很好的例子。

一次处理一个数字

以 10 为底的数字 n 有多少位？好吧，如果数字中有 k 位，那么我们会认为最大的数字是 10^k 的某个倍数。最大的 k 位数是 999...9，k 次，这等于 10^{k + 1} - 1。因此，如果我们知道 n 中有 k 位数，那么我们知道 n 的值最多为 10^{k + 1} - 1。如果我们想用 n 来求解 k，我们得到

n ≤ 10^k+1 - 1

n + 1 ≤ 10^k+1

log₁₀ (n + 1) ≤ k + 1

(log₁₀ (n + 1)) - 1 ≤ k

从中我们得到 k 大约是 n 的以 10 为底的对数。也就是说，n的位数是O(log n)。

例如，让我们考虑将两个太大而无法放入机器字中的大数字相加的复杂性。假设我们有以 10 为基数的数字，我们将数字称为 m 和 n。添加它们的一种方法是通过小学方法 - 一次写出一个数字，然后从右到左工作。例如，要添加 1337 和 2065，我们首先将数字写为

    1  3  3  7
+   2  0  6  5
==============

我们添加最后一位并携带1：

          1
    1  3  3  7
+   2  0  6  5
==============
             2

然后我们添加倒数第二个（“倒数第二个”）数字并携带 1：

       1  1
    1  3  3  7
+   2  0  6  5
==============
          0  2

接下来，我们添加倒数第三个（“倒数第二个”）数字：

       1  1
    1  3  3  7
+   2  0  6  5
==============
       4  0  2

最后，我们添加倒数第四个（“preantepenultimate”...我喜欢英语）数字：

       1  1
    1  3  3  7
+   2  0  6  5
==============
    3  4  0  2

现在，我们做了多少工作？每个数字我们总共做了 O(1) 个工作（也就是一个恒定的工作量），总共有 O(max{log n, log m}) 个需要处理的数字。这给出了总 O(max{log n, log m}) 的复杂度，因为我们需要访问两个数字中的每个数字。

许多算法通过在某个基数中一次处理一个数字来获得 O(log n) 项。一个经典的例子是 radix sort，它一次将整数排序一位。基数排序有很多种，但它们通常运行时间为 O(n log U)，其中 U 是被排序的最大可能整数。这样做的原因是每次排序都需要 O(n) 时间，并且总共需要 O(log U) 次迭代来处理被排序的最大数字的每个 O(log U) 位。许多高级算法，例如Gabow's shortest-paths algorithm 或Ford-Fulkerson max-flow algorithm 的缩放版本，在其复杂性中都有一个对数项，因为它们一次只工作一个数字。

关于您如何解决该问题的第二个问题，您可能需要查看this related question，它探索了一个更高级的应用程序。鉴于此处描述的问题的一般结构，当您知道结果中有一个对数项时，您现在可以更好地了解如何思考问题，因此我建议您在给出答案之前不要查看答案一些想法。

希望这会有所帮助！

【讨论】：

【解决方案2】：

当我们谈论 big-Oh 描述时，我们通常谈论的是解决给定 size 问题所需的时间。通常，对于简单的问题，大小仅以输入元素的数量为特征，通常称为 n 或 N。（显然，这并不总是正确的——图的问题通常以顶点数 V 和边数，E；但现在，我们将讨论对象列表，列表中有 N 个对象。）

我们说一个问题“是（N 的某个函数）的大哦”当且仅当：

对于所有 N> 一些任意 N_0，有一些常数 c，这样算法的运行时间小于常数 c 倍（N 的某个函数）

换句话说，不要考虑设置问题的“恒定开销”很重要的小问题，而要考虑大问题。在考虑大问题时，（N 的某个函数）的大哦意味着运行时间仍然总是小于该函数的某个常数倍。总是。

简而言之，该函数是一个上限，直到一个常数因子。

所以，“log(n) 的大哦”的含义与我上面所说的相同，只是“N 的某些函数”被替换为“log(n)”。

所以，你的问题告诉你要考虑二分搜索，所以让我们考虑一下。假设您有一个按升序排序的 N 个元素的列表。您想查明该列表中是否存在某个给定的数字。不是二分搜索的一种方法是只扫描列表的每个元素，看看它是否是你的目标数字。您可能会很幸运并在第一次尝试时找到它。但在最坏的情况下，您将检查 N 个不同的时间。这不是二进制搜索，也不是 log(N) 的大哦，因为没有办法强制它进入我们上面勾勒的标准。

你可以选择任意常数为 c=10，如果你的列表有 N=32 个元素，你没问题：10*log(32) = 50，它大于 32 的运行时间。但如果N=64, 10*log(64) = 60，小于 64 的运行时间。你可以选择 c=100，或 1000，或一个 gazillion，你仍然可以找到一些违反该规则的 N要求。也就是说，没有N_0。

但是，如果我们进行二分搜索，我们会选择中间元素并进行比较。然后我们扔掉一半的数字，然后再做一次，一次又一次，以此类推。如果你的 N=32，你只能做大约 5 次，也就是 log(32)。如果您的 N=64，您只能这样做大约 6 次，依此类推。现在您可以选择任意常数 c，从而始终满足大 N 值的要求。

在所有这些背景下，O(log(N)) 通常意味着您有一些方法可以做一件简单的事情，从而将您的问题规模减半。就像上面的二进制搜索一样。一旦你把问题切成两半，你就可以一次又一次地把它切成两半。但是，至关重要的是，您不能做的是一些预处理步骤，这将花费比 O(log(N)) 时间更长的时间。因此，举例来说，你不能将两个列表混为一个大列表，除非你也能找到一种方法在 O(log(N)) 时间内完成。

（注意：几乎总是，Log(N) 表示以二为底的对数，这是我在上面假设的。）

【讨论】：

【解决方案3】：

在下面的解决方案中，所有带有递归调用的行都在 X 和 Y 的子数组的给定大小的一半。其他行在恒定时间内完成。递归函数为T(2n)=T(2n/2)+c=T(n)+c=O(lg(2n))=O(lgn)。

你从 MEDIAN(X, 1, n, Y, 1, n) 开始。

MEDIAN(X, p, r, Y, i, k) 
if X[r]<Y[i]
    return X[r]
if Y[k]<X[p]
    return Y[k]
q=floor((p+r)/2)
j=floor((i+k)/2)
if r-p+1 is even
    if X[q+1]>Y[j] and Y[j+1]>X[q]
        if X[q]>Y[j]
            return X[q]
        else
            return Y[j]
    if X[q+1]<Y[j-1]
        return MEDIAN(X, q+1, r, Y, i, j)
    else
        return MEDIAN(X, p, q, Y, j+1, k)
else
    if X[q]>Y[j] and Y[j+1]>X[q-1]
        return Y[j]
    if Y[j]>X[q] and X[q+1]>Y[j-1]
        return X[q]
    if X[q+1]<Y[j-1]
        return MEDIAN(X, q, r, Y, i, j)
    else
        return MEDIAN(X, p, q, Y, j, k)

【讨论】：

【解决方案4】：

Log 术语在算法复杂度分析中经常出现。以下是一些解释：

1。你如何表示一个数字？

让我们取数字 X = 245436。“245436”这个符号包含隐含的信息。明确该信息：

X = 2 * 10 ^ 5 + 4 * 10 ^ 4 + 5 * 10 ^ 3 + 4 * 10 ^ 2 + 3 * 10 ^ 1 + 6 * 10 ^ 0

这是数字的十进制扩展。所以，我们需要表示这个数字的最少信息量是6位。这并非巧合，因为任何小于 10^d 的数字都可以用 d 个数字表示。

那么代表 X 需要多少位数字？这等于 X 中 10 的最大指数加 1。

==> 10 ^ d > X
==> 日志 (10 ^ d) > 日志(X)
==> d* log(10) > log(X)
==> d > log(X) // 日志再次出现...
==> d = floor(log(x)) + 1

另请注意，这是表示此范围内数字的最简洁方式。任何减少都会导致信息丢失，因为丢失的数字可以映射到其他 10 个数字。例如：12* 可以映射到 120、121、122、...、129。

2。如何在 (0, N - 1) 中搜索一个数？

取 N = 10^d，我们使用我们最重要的观察结果：

唯一标识 0 到 N - 1 = log(N) 位范围内的值的最小信息量。

这意味着，当被要求在整数行上搜索一个从 0 到 N - 1 的数字时，我们需要至少 log(N) 次尝试找到它。为什么？任何搜索算法在搜索数字时都需要一个接一个地选择一个数字。

它需要选择的最小位数是 log(N)。因此，在大小为 N 的空间中搜索数字所需的最小操作数是 log(N)。

你能猜出二分查找、三元查找或十进制查找的顺序复杂度吗？
O(log(N))！

3。如何对一组数字进行排序？

当要求将一组数字 A 排序到数组 B 中时，它是这样的 ->

Permute Elements

原始数组中的每个元素都必须映射到它在排序数组中的对应索引。所以，对于第一个元素，我们有 n 个位置。要在 0 到 n - 1 这个范围内正确找到对应的索引，我们需要…log(n) 操作。

下一个元素需要 log(n-1) 操作，下一个 log(n-2) 等等。总数为：

==> log(n) + log(n - 1) + log(n - 2) + … + log(1)

使用 log(a) + log(b) = log( a * b),

==> log(n!)

这可以是approximated 到 nlog(n) - n。
O(n*log(n))！

因此我们得出结论，没有比 O(n*log(n)) 做得更好的排序算法了。一些具有这种复杂性的算法是流行的合并排序和堆排序！

这些是我们在算法的复杂性分析中经常看到 log(n) 弹出的一些原因。同样可以扩展到二进制数。我在这里制作了一个视频。
Why does log(n) appear so often during algorithm complexity analysis?

干杯！

【讨论】：

【解决方案5】：

我们将时间复杂度称为 O(log n)，当解决方案基于 n 上的迭代时，每次迭代中完成的工作是前一次迭代的一小部分，因为算法朝着解决方案工作。

【讨论】：

【解决方案6】：

还不能评论...死灵了！ Avi Cohen 的回答不正确，试试：

X = 1 3 4 5 8
Y = 2 5 6 7 9

没有一个条件为真，因此 MEDIAN(X, p, q, Y, j, k) 将削减这两个五。这些是非递减序列，并非所有值都是不同的。

也可以试试这个具有不同值的偶数长度示例：

X = 1 3 4 7
Y = 2 5 6 8

现在 MEDIAN(X, p, q, Y, j+1, k) 将削减四个。

我提供了这个算法，用 MEDIAN(1,n,1,n) 调用它：

MEDIAN(startx, endx, starty, endy){
  if (startx == endx)
    return min(X[startx], y[starty])
  odd = (startx + endx) % 2     //0 if even, 1 if odd
  m = (startx+endx - odd)/2
  n = (starty+endy - odd)/2
  x = X[m]
  y = Y[n]
  if x == y
    //then there are n-2{+1} total elements smaller than or equal to both x and y
    //so this value is the nth smallest
    //we have found the median.
    return x
  if (x < y)
    //if we remove some numbers smaller then the median,
    //and remove the same amount of numbers bigger than the median,
    //the median will not change
    //we know the elements before x are smaller than the median,
    //and the elements after y are bigger than the median,
    //so we discard these and continue the search:
    return MEDIAN(m, endx, starty, n + 1 - odd)
  else  (x > y)
    return MEDIAN(startx, m + 1 - odd, n, endy)
}

【讨论】：