为什么简单的斐波那契 Haskell 比 C++ 快答案

【问题标题】：Why is Haskell faster than C++ for a simple fibonacci为什么简单的斐波那契 Haskell 比 C++ 快
【发布时间】：2016-06-22 00:12:13
【问题描述】：

Haskell 标签中的问题通常是为什么 Haskell 与 X 相比如此慢。大多数情况下，您可以将其归结为 String 而不是 Text 或 ByteString 的用法。非严格评估或缺少类型签名。

但是这里我有一个简单的斐波那契计算器，它的性能比 C++ 高出大约 2 倍。这可能是缺乏 C++ 知识 - 但我从一个朋友那里得到了代码，他曾经在这种语言。

★ g++ -O3 fib2.cc -o cc-fib -lgmpxx -lgmp 
★ time ./cc-fib > /dev/null
./cc-fib > /dev/null  8,23s user 0,00s system 100% cpu 8,234 total

★ ghc -O3 --make -o hs-fib fib1.hs
[1 of 1] Compiling Main             ( fib1.hs, fib1.o )
Linking hs-fib ...
★ time ./hs-fib > /dev/null
./hs-fib > /dev/null  4,36s user 0,03s system 99% cpu 4,403 total

在 haskell 文件中，我只使用了一个严格的zipWith' 和一个严格的add' 函数（这是使用扩展名BangPatterns 的地方 - 它只是告诉编译器评估参数x/@987654329 @ 在执行添加之前）以及添加显式类型签名。

两个版本都使用 bigint，所以这似乎与我相当，而且 c++ 代码不使用具有指数运行时间的“标准”递归，但是一个应该表现良好的记忆版本（或者至少这是我的想法- 如果我错了，请纠正我）。

使用的设置是：

在相当新的笔记本电脑上运行 Linux 64 位 (Mint)
ghc-7.10.3
g++ 4.8.4 + libgmp-dev 2:5.1.3+dfsg-1ubuntu1

`fib.cc`

#include <iostream>
#include <gmpxx.h>

mpz_class fib(int n) {
    mpz_class p1 = 0;
    mpz_class p2 = 1;
    mpz_class result;
    if ( n == 0 ) return 0;
    if ( n == 1 ) return 1;
    for(int i = 2; i <= n ; i ++ ) {
        result = p1 + p2;
        p1 = p2;
        p2 = result;
    }
    return result;
}

int main () {
    std::cout<<fib(1000000)<<std::endl;
    return 0;
}

`fib.hs`

{-# LANGUAGE BangPatterns -#}
module Main where

fib1 :: [Integer]
fib1 = 0:1:zipWith' (add') fib1 (tail fib1)
     where zipWith' :: (Integer -> Integer -> Integer) -> [Integer] -> [Integer] -> [Integer]
           zipWith' _ [] _ = []
           zipWith' _ _ [] = []
           zipWith' f (x:xs) (y:ys) = let z = f x y in z:zipWith' f xs ys
           add' :: Integer -> Integer -> Integer
           add' !x !y = let z = x + y in z `seq` z

fib4 :: [Integer]
fib4 = 0:1:zipWith (+) fib4 (tail fib4)

main :: IO ()
main = print $ fib1 !! 1000000

【问题讨论】：

这似乎更像是 GMP 的设计权衡与您的 Haskell 实现的 Integer 的问题，而不是 C++ 本身与 Haskell 的问题。
再想一想，您可能在 C++ 中做了一堆不必要的复制。我不确定mpz_class 的operator= 是如何工作的。
引自主页“GMP 精心设计以尽可能快，无论是对于小操作数还是对于大操作数” 我认为 gmp 将是快速的正确选择执行。您能详细介绍一下这些设计选择吗？
@user2357112：GHC 使用 GMP，所以可能不是这样。（从技术上讲，这只是一种可能的编译时配置，但我在实践中从未见过任何其他配置；我知道的另一种是“整数简单”，应该更慢。）
您可以通过将p1 = p2; p2 = result; 替换为p1.swap(p2); p2.swap(result); 来加速C++ 实现

标签： c++ performance haskell

【解决方案1】：

鉴于您要打印的数量非常庞大，iostreams 的默认性能不佳可能与此有关。确实，在我的系统上，把

 std::ios_base::sync_with_stdio(false);

main 开头的时间略有改进（从 20 秒到 18 秒）。

此外，大量复制大量数字势必会减慢速度。相反，如果您在每个步骤中同时更新 p1 和 p2，则无需复制它们。您也只需要循环中的一半步骤。像这样：

mpz_class fib(int n) {
    mpz_class p1 = 0;
    mpz_class p2 = 1;
    for(int i = 1; i <= n/2 ; i ++ ) {
        p1 += p2;
        p2 += p1;
    }
    return (n % 2) ? p2 : p1;
}

这极大地加快了我的系统（从 18 秒到 8 秒）。

当然，要真正了解使用 GMP 可以做到多快，您应该只使用执行该操作的函数：

mpz_class fib(int n) {
    mpz_class result;
    mpz_fib_ui(result.get_mpz_t(), n);
    return result;
}

这在我的机器上实际上是即时的（是的，它打印出与其他两种方法相同的 208,989 位数字）。

【讨论】：

mpz_fib_ui 可能使用完全不同的算法（例如 this Haskell code that computes fib n in O(log n) steps) 使比较毫无意义。
@Cactus：是的，但公平地说，这已经毫无意义了。这两种语言一开始就没有做同样的事情。