【问题标题】:memory efficient way内存高效方式
【发布时间】:2019-03-14 15:01:25
【问题描述】:

我有两个用 Go 编写的类似程序的示例。该代码的主要目的是使用结构中的值对结构进行排序。

指针示例

package main

import (
    "fmt"
    "sort"
)

type payload struct {
    data string
    value  float64
}

type container struct {
    counter int
    storage map[int]*payload
}

type payloadSlice []*payload

// Len is part of sort.Interface.
func (p payloadSlice) Len() int {
    return len(p)
}

// Swap is part of sort.Interface.
func (p payloadSlice) Swap(i, j int) {
    p[i], p[j] = p[j], p[i]
}

// Less is part of sort.Interface. We use count as the value to sort by
func (p payloadSlice) Less(i, j int) bool {
    return p[i].value < p[j].value
}
func main() {
    name := "special_unique_name"
    var m = map[string]container{
        name: {counter: 10, storage: map[int]*payload{
            5: {data: "epsilon", value: 55},8: {data: "theta", value: 85},4: {data: "delta", value: 48},1: {data: "alpha", value: 14},10: {data: "kappa", value: 101},
            3: {data: "gamma", value: 31},6: {data: "zeta", value: 63},2: {data: "beta", value: 26},9: {data: "iota", value: 92},7: {data: "eta", value: 79},
        }},
    }
    s := make(payloadSlice, 0, len(m[name].storage))
    for _, v := range m[name].storage {
        s = append(s, v)
    }
    sort.Sort(s)

    for _, v := range s {
        fmt.Println(name, v)
    }
}

数值示例

package main

import (
    "fmt"
    "sort"
)

type payload struct {
    data string
    value  float64
}

type container struct {
    counter int
    storage map[int]payload
}

type payloadSlice []payload

// Len is part of sort.Interface.
func (p payloadSlice) Len() int {
    return len(p)
}

// Swap is part of sort.Interface.
func (p payloadSlice) Swap(i, j int) {
    p[i], p[j] = p[j], p[i]
}

// Less is part of sort.Interface. We use count as the value to sort by
func (p payloadSlice) Less(i, j int) bool {
    return p[i].value < p[j].value
}
func main() {
    name := "special_unique_name"
    var m = map[string]container{
        name: {counter: 10, storage: map[int]payload{
            5: {data: "epsilon", value: 55},8: {data: "theta", value: 85},4: {data: "delta", value: 48},1: {data: "alpha", value: 14},10: {data: "kappa", value: 101},
            3: {data: "gamma", value: 31},6: {data: "zeta", value: 63},2: {data: "beta", value: 26},9: {data: "iota", value: 92},7: {data: "eta", value: 79},
        }},
    }
    s := make(payloadSlice, 0, len(m[name].storage))
    for _, v := range m[name].storage {
        s = append(s, v)
    }
    sort.Sort(s)

    for _, v := range s {
        fmt.Println(name, v)
    }
}

我想知道两个时刻:

  1. 哪个示例会节省内存? (我猜是指针方式)

  2. 如何使用地图内具有不同数量结构的测试数据来衡量这些示例的性能?您能帮我创建 Benchmark 吗?

我想地图中每个结构的大小平均会在 1-2kB 之间变化。

【问题讨论】:

  • 如果通过“内存高效”,您的意思是使用更少的内存,使用指针不一定更有效,因为您要添加 64 位(和指针取消引用,但这是一个时间权衡)每个值的顶部。使用您的程序中最合乎逻辑的一个,并在您遇到性能问题时进行配置。 (另外,不管你的有效载荷数据有多大,你的有效载荷结构总是相同的大小)
  • 欢迎来到 StackOverflow!尽量将您的问题保留在一个问题上,并在问题正文中而不是在外部链接中包含任何相关代码。随意使用外部链接来提供额外的上下文。
  • JimB,我完全没有性能问题,我对哪种方法更好以及如何正确测试它很感兴趣。我用 golang "testing" 包做了一个简单的基准测试,但是我只能用一个很小的预定义数据集来测试代码,我想知道如何用更大的数据集进行测试。
  • 从程序中有意义的那个开始,因为在 99.9% 的情况下,其他情况无关紧要。在 64 位系统上,每个 payload 结构体只有 24 个字节,因此添加指针可能同样会减慢速度。如果您想使用更大的数据集进行测试,您只需要一个更大的数据集,这通常伴随着确定现实世界的使用情况,而不是事先猜测。

标签: go testing benchmarking


【解决方案1】:

“内存效率”是一个相当宽泛的术语,在像 Go 这样具有独立堆和堆栈的垃圾收集语言中可能意味着几个非常不同的东西:

  • 什么占用的内存最少?
  • 产生最小 GC 压力的因素是什么?

如果您想最小化应用程序的占用空间,您可能希望在您在多个范围(例如多个函数)中使用值的任何时候都使用指针。这减少了复制,但增加了等于指针大小(64 位系统上为 8 个字节)的开销。

如果您想最小化 GC 压力,您可能只希望在需要指针语义或底层值非常大时才使用指针。指针将值强制到堆上,这会受到垃圾回收,而值可以保留在堆栈上,但不是(当函数返回时,堆栈被整个销毁,这是线程安全的,需要没有参考跟踪)。

“GC 压力”是指在堆上创建和销毁的东西越多,垃圾收集器要做的工作就越多,这会占用应用程序正在执行的实际工作之外的处理器时间。每次在堆上分配时,如果没有新值的空间,垃圾收集器将尝试通过在堆上查找不再需要的值来释放空间。你在堆上分配的越多,GC 运行的频率就越高,运行时间也就越长。

对于第二个问题,您可以(并且应该!)使用benchmarking facility of the testing package 衡量针对您的特定情况的各种方法的性能。确保使用真实的数据和操作进行测试;使用“虚拟”数据类型的微基准或基准不太可能产生任何价值的数据。该软件包的文档,以及通过网络搜索轻松找到的无数博客文章和教程,应该会指导您正确地了解如何在 Go 中编写和使用基准测试。

在您的具体情况下,请记住您的数据类型 - 就这个问题而言 - 比您想象的要小:64 位系统上的 24 个字节,无论字符串的长度如何。为什么?因为 string 在内部是一个结构,其中包含一个 int 的长度和一个指向底层字节的指针。当您尝试优化内存使用时,请记住字符串、切片(但不是数组!)和映射都是非常小的结构,其中包含指向其基础数据的指针。

最重要的是过早的优化是万恶之源。您应该为两件事编写代码:功能性和可读性。在它们提供您需要的功能时使用指针语义,并且使用起来具有直观意义。如果您衡量资源问题(CPU 或内存),那么您应该分析您的应用程序以找到问题的根源,确定它们的优先级并优化它们。

在您测量和分析性能问题之前,您不会遇到性能问题。

【讨论】:

    猜你喜欢
    • 2012-07-20
    • 2014-01-29
    • 2011-04-05
    • 2014-01-12
    • 2017-03-05
    • 1970-01-01
    • 1970-01-01
    • 2019-07-09
    • 2020-09-05
    相关资源
    最近更新 更多