【发布时间】:2021-11-23 08:53:46
【问题描述】:
我有一个可变的(但限制在组合大小)需要传递给 C 的 GoString 数量,我想尽可能便宜地做到这一点。我将多次执行此操作(因此可以将重复使用的预分配缓冲区视为零成本)。
我最初的方法是遍历 GoString,将每个转换为 CString 并将其推送到 C。
for _, str := range mystrings {
cstr := C.CString(str)
defer C.free(unsafe.Pointer(cstr))
C.push_str(pushStrFn, cstr)
}
当然,由于C.CString 以及 N 个 CGo 调用,这执行了 N 个堆分配 - 所有这些都不便宜。
接下来是在 Go 中使用分配的开始时间 strings.Builder 在 Go 中构建单个大字符串,然后在单个 CGo 调用中将其与一些长度信息一起传递给 C。这是一个 CString 调用和一个 CGo 调用 - 一个实质性的改进。
builder.Reset()
for _, str := range mystrings {
builder.WriteString(str)
}
C.push_strs(pushStrsFn, C.CString(builder.String()))
但是这种方法仍然在执行不必要的复制!理想情况下,我想预先分配一大块可以传递给 C 的内存,然后直接将字符串复制到它而不使用大型 GoString 中介。
我能够提前预分配一个大数组,并遍历 GoStrings 中的字符,一次复制一个。这避免了中间复制,但比专用的字符串复制功能(如构建器的功能)慢得多。
cCharArray := C.malloc(C.size_t(MAX_SIZE) * C.size_t(unsafe.Sizeof(uintptr(0))))
goCharArray := (*[1<<30 - 1]C.char)(cCharArray)
for _, str := range mystrings {
for i, c := range str {
goCharArray[offset+i] = C.char(c)
}
}
C.push_charArray(pushCharArrayFn, (*C.char)(cCharArray))
有没有我想念的更快的方法来做到这一点?我可以以某种方式将 C 缓冲区提供给 strings.Builder,还是直接使用字符串复制函数到 C 缓冲区?
【问题讨论】:
-
你确定你的架构是正确的吗? Go-C 接口本身很慢。
-
我知道,这很痛苦,而且根本不是我如何处理这个问题的首选,而是 c'est la vie。
标签: string go optimization cgo