【发布时间】:2011-01-29 20:22:06
【问题描述】:
假设您有一个巨大的(40+ GB)特征值(浮点)矩阵,行是不同的特征,列是样本/图像。
该表是按列预先计算的。 然后它被完全按行和多线程访问(每个线程加载一整行)几次。
处理这个矩阵的最佳方法是什么?我特别琢磨了5点:
- 由于它在 x64 PC 上运行,我可以一次对整个矩阵进行内存映射,但这有意义吗?
- 多线程的影响(还有多线程初始计算?)?
- 矩阵如何布局:行还是列?
- 在预计算完成后将矩阵标记为只读有帮助吗?
- 可以使用 http://www.kernel.org/doc/man-pages/online/pages/man2/madvise.2.html 之类的东西来加快速度吗?
【问题讨论】:
-
这个问题可能会因为 太有趣 而被关闭——但我希望不会。对操作系统有限制吗? (从链接猜测 Linux。)
-
我不明白为什么它会被关闭,我错过了一些规则吗?是的,该软件目前仅限于 Linux。但也欢迎提供有关 Windows 的答案。