【发布时间】:2012-09-23 00:28:52
【问题描述】:
所以我有一个正在处理的项目,它使用 OpenCV 来检测移动物体的运动。我正在尝试加快检测速度并有一个嵌套的 for 循环,我想使用 CUDA 来加速它。我在 Visual Basic 中设置了 CUDA 集成。这是我的 .cpp 文件中的嵌套 for 循环。
for (int i=0; i<NumberOfFeatures; i++)
{
// Compute integral image.
cvIntegral(mFeatureImgs[i], mFirstOrderIIs[i]);
for (int j=0; j<NumberOfFeatures; j++)
{
// Compute product feature image.
cvMul(mFeatureImgs[i], mFeatureImgs[j], mWorker);
// Compute integral image.
cvIntegral(mWorker, mSecondOrderIIs[i][j]);
}
}
我对 CUDA 比较陌生,所以我的问题是,有人可以向我展示一个示例,说明如何使用 CUDA 使这个嵌套的 for 循环运行得更快吗?
【问题讨论】:
-
你考虑过使用 OpenCV gpu 模块吗?