【问题标题】:Efficient way to return stl vector by value from function从函数中按值返回stl向量的有效方法
【发布时间】:2017-04-08 09:11:54
【问题描述】:

这是Efficient way to return a std::vector in c++的一个扩展问题

#include <cstdio>
#include <vector>
#include <chrono>

std::vector<int> func1() {
    std::vector<int> v;
    v.reserve(1e6);
    for (int i = 0; i < 1e6; i++) v.emplace_back(i);
    return v;
}

std::vector<int> func2() {
    std::vector<int> v;
    v.reserve(1e6);
    for (int i = 0; i < 1e6; i++) v.emplace_back(i);
    return std::move(v);
}

int main() {
    auto start1 = std::chrono::steady_clock::now();
    std::vector<int> v1 = func1();
    auto end1 = std::chrono::steady_clock::now();
    printf("%d\n", std::chrono::duration_cast<std::chrono::nanoseconds>(end1-start1).count());

    auto start2 = std::chrono::steady_clock::now();
    std::vector<int> v2 = func2();
    auto end2 = std::chrono::steady_clock::now();
    printf("%d\n", std::chrono::duration_cast<std::chrono::nanoseconds>(end2-start2).count());

/*
    auto start3 = std::chrono::steady_clock::now();
    std::vector<int> v3 = v2;
    auto end3 = std::chrono::steady_clock::now();
    printf("%d\n", std::chrono::duration_cast<std::chrono::nanoseconds>(end3-start3).count());
*/

    return 0;
}

在方法 2 中,我明确告诉编译器我要移动而不是复制向量,但多次运行代码显示方法 1 有时实际上优于方法 2,即使方法 2 获胜,也差不了多少.

方法 3 始终是最好的。当我必须从函数返回时如何模拟方法 3? (不,我不能通过引用)

使用 gcc 6.1.0

【问题讨论】:

  • a) 防止最微小的不需要的编译器优化。作为编译器,我会删除例如。 v3,所以第三个是最快的不是你想知道的。
  • 请注意,您的基准测试存在缺陷:您也在计时插入向量,包括 重新分配
  • 并且编译器也可以对func1使用移动,它不必复制。
  • func2 的 Clang 警告:警告:在返回语句中移动本地对象可防止复制省略 [-Wpessimizing-move]

标签: c++ c++11 stl


【解决方案1】:

方法 1 - 您正在使用 Named Return Value Optimization (NRVO)。实际上,这是最好的,因为在优化代码中根本没有构建临时对象。如果编译器无法进行 NRVO,它将使用移动语义,与方法 2 相同。

方法 2 - 您正在有效地关闭 NRVO,并强制移动目标 std::vector 的构造函数。所以,这样不好,方法一。

方法 3 - 实际上,您是在此处复制向量,这是迄今为止最差的性能。但是,由于您一次复制向量(一大块内存,而不是许多 emplaces) - 您可以获得最佳性能,但这在方法 1 或 2 的用例中是不可复制的。

NRVO 如何运作? 当您只有一个返回值时:在这种情况下是std::vector&lt;int&gt; v,编译器根本不会在函数内部创建这个向量。它创建未命名的右值向量,您将返回该向量,并将对它的引用传递给您的函数。

这样的事情会在优化的代码中发生:

std::vector<int> func1(std::vector<int>& hidden) {
     hidden.emplace_back(stuff);
     return;
}

【讨论】:

  • 我明白了。放弃评论。我同意。那个测试用例在这个工作台上没有任何意义,因为它实际上是在比较苹果和橘子。
猜你喜欢
  • 2012-09-18
  • 2013-05-02
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2017-02-26
  • 1970-01-01
相关资源
最近更新 更多