【发布时间】:2010-11-08 13:57:42
【问题描述】:
对于计算向量 x 与大量向量 y_i 的点积,我最好的选择是什么,其中 x 和 y_i 的长度约为 10k。
- 将 y 推入矩阵并使用优化的
s/dgemv例程? - 或者尝试手动编码 SSE2 解决方案(根据 cpuinfo,我没有 SSE3)。
我只是在这里寻找一般指导,所以任何建议都会很有用。
是的,我确实需要表演。
谢谢你的光。
【问题讨论】:
-
你使用的是哪个编译器?
标签: c optimization intrinsics