【问题标题】:How to train OpenCV SVM with BoW Properly如何正确使用 BoW 训练 OpenCV SVM
【发布时间】:2015-03-16 04:57:50
【问题描述】:

我无法训练 SVM 识别我的对象。我正在尝试使用 SURF + Bag Of Words + SVM 来做到这一点。我的问题是分类器没有检测到任何东西。所有结果都是0。

这是我的代码:

Ptr<FeatureDetector> detector = FeatureDetector::create("SURF");
Ptr<DescriptorExtractor> descriptors = DescriptorExtractor::create("SURF");

string to_string(const int val) {
    int i = val;
    std::string s;
    std::stringstream out;
    out << i;
    s = out.str();
    return s;
}

Mat compute_features(Mat image) {
    vector<KeyPoint> keypoints;
    Mat features;

    detector->detect(image, keypoints);
    KeyPointsFilter::retainBest(keypoints, 1500);
    descriptors->compute(image, keypoints, features);

    return features;
}

BOWKMeansTrainer addFeaturesToBOWKMeansTrainer(String dir, BOWKMeansTrainer& bowTrainer) {
    DIR *dp;
    struct dirent *dirp;
    struct stat filestat;

    dp = opendir(dir.c_str());


    Mat features;
    Mat img;

    string filepath;
    #pragma loop(hint_parallel(4))
    for (; (dirp = readdir(dp));) {
        filepath = dir + dirp->d_name;

        cout << "Reading... " << filepath << endl;

        if (stat( filepath.c_str(), &filestat )) continue;
        if (S_ISDIR( filestat.st_mode ))         continue;

        img = imread(filepath, 0);

        features = compute_features(img);
        bowTrainer.add(features);
    }


    return bowTrainer;
}

void computeFeaturesWithBow(string dir, Mat& trainingData, Mat& labels, BOWImgDescriptorExtractor& bowDE, int label) {
    DIR *dp;
    struct dirent *dirp;
    struct stat filestat;

    dp = opendir(dir.c_str());

    vector<KeyPoint> keypoints;
    Mat features;
    Mat img;

    string filepath;

    #pragma loop(hint_parallel(4))
    for (;(dirp = readdir(dp));) {
        filepath = dir + dirp->d_name;

        cout << "Reading: " << filepath << endl;

        if (stat( filepath.c_str(), &filestat )) continue;
        if (S_ISDIR( filestat.st_mode ))         continue;

        img = imread(filepath, 0);

        detector->detect(img, keypoints);
        bowDE.compute(img, keypoints, features);

        trainingData.push_back(features);
        labels.push_back((float) label);
    }

    cout << string( 100, '\n' );
}

int main() {
    initModule_nonfree();

    Ptr<DescriptorMatcher> matcher = DescriptorMatcher::create("FlannBased");

    TermCriteria tc(CV_TERMCRIT_ITER + CV_TERMCRIT_EPS, 10, 0.001);
    int dictionarySize = 1000;
    int retries = 1;
    int flags = KMEANS_PP_CENTERS;
    BOWKMeansTrainer bowTrainer(dictionarySize, tc, retries, flags);
    BOWImgDescriptorExtractor bowDE(descriptors, matcher);

    string dir = "./positive_large", filepath;
    DIR *dp;
    struct dirent *dirp;
    struct stat filestat;

    cout << "Add Features to KMeans" << endl;
    addFeaturesToBOWKMeansTrainer("./positive_large/", bowTrainer);
    addFeaturesToBOWKMeansTrainer("./negative_large/", bowTrainer);

    cout << endl << "Clustering..." << endl;

    Mat dictionary = bowTrainer.cluster();
    bowDE.setVocabulary(dictionary);

    Mat labels(0, 1, CV_32FC1);
    Mat trainingData(0, dictionarySize, CV_32FC1);


    cout << endl << "Extract bow features" << endl;

    computeFeaturesWithBow("./positive_large/", trainingData, labels, bowDE, 1);
    computeFeaturesWithBow("./negative_large/", trainingData, labels, bowDE, 0);

    CvSVMParams params;
    params.kernel_type=CvSVM::RBF;
    params.svm_type=CvSVM::C_SVC;
    params.gamma=0.50625000000000009;
    params.C=312.50000000000000;
    params.term_crit=cvTermCriteria(CV_TERMCRIT_ITER,100,0.000001);
    CvSVM svm;

    cout << endl << "Begin training" << endl;

    bool res=svm.train(trainingData,labels,cv::Mat(),cv::Mat(),params);

    svm.save("classifier.xml");

    //CvSVM svm;
    svm.load("classifier.xml");

    VideoCapture cap(0); // open the default camera

    if(!cap.isOpened())  // check if we succeeded
        return -1;

    Mat featuresFromCam, grey;
    vector<KeyPoint> cameraKeyPoints;
    namedWindow("edges",1);
    for(;;)
    {
        Mat frame;
        cap >> frame; // get a new frame from camera
        cvtColor(frame, grey, CV_BGR2GRAY);
        detector->detect(grey, cameraKeyPoints);
        bowDE.compute(grey, cameraKeyPoints, featuresFromCam);

        cout << svm.predict(featuresFromCam) << endl;
        imshow("edges", frame);
        if(waitKey(30) >= 0) break;
    }   

        return 0;
}

您应该知道我从现有项目中获得了具有良好结果的参数,所以我认为它们在我的代码中也会有用(但最终可能不会)。

我有 310 张正片和 508 张负片。我尝试使用相同数量的正面和负面图像,但结果是相同的。 我要检测的对象是汽车方向盘。这里是my dataset

你知道我做错了什么吗?谢谢!

【问题讨论】:

    标签: opencv svm surf object-detection


    【解决方案1】:

    首先,使用现有项目中的相同参数并不能证明您使用的是正确的参数。事实上,在我看来,这完全是一种无稽之谈(无意冒犯)。这是因为,SVM 参数直接受到数据集和描述符提取方法的影响。为了获得正确的参数,您必须进行交叉验证。因此,如果这些参数是从不同的识别任务中获得的,那将没有任何意义。例如,在我的面部验证项目中,gammaC 的最佳参数分别为 0.0625 和 10。

    您的方法的另一个重要问题是测试图像。据我从你的代码中看到的,你没有使用磁盘中的图像来测试你的分类器,所以从这里的其余部分我会做一些假设。如果您从相机获取的测试图像与您的正图像不同,它将失败。我所说的不同是指这个;您必须确保您的测试图像仅由方向盘组成,因为您的训练图像仅包含方向盘。如果您的测试图像包含例如带有它的汽车座椅,那么您的测试图像的 BoW 描述符将与您的火车图像 BoW 描述符完全不同。因此,简单地说,您的测试图像不应该包含带有其他对象的方向盘,它们应该只包含方向盘。

    如果您满足这些要求,那么使用训练图像来测试您的系统是最基本的方法。即使在那种情况下你失败了,你也可能有一些实施问题。其他方法可以是这样;将您的训练数据分成两部分,这样您就有四个分区:

    • 正面的火车图像
    • 负列车图像
    • 阳性测试图像
    • 负面测试图像

    仅使用训练图像来训练系统并使用测试图像对其进行测试。同样,您必须通过交叉验证指定参数。

    除此之外,您可能需要检查一些特定步骤以定位问题,然后再执行我之前写的操作:

    1. 每张图像检测到多少个关键点?相似的图像应该产生相似数量的关键点。
    2. 您知道,BoW 描述符是图像的 SURF 描述符的直方图。确保相似的图像会产生相似的直方图(BoW 描述符)。最好通过可视化直方图来检查这一点。
    3. 如果满足上一步,问题很可能出在SVM训练步骤上,这是非常重要的一步(也许是最重要的一步)。

    我希望我能够强调交叉验证的重要性。进行交叉验证!

    祝你好运!

    【讨论】:

    • 感谢您的详细解答!!!我有事要问你。所以可以说我的雨方向盘是白色背景的方向盘。您是在告诉我,如果我的测试图像带有背景(车速表、座椅等),它就不起作用?
    • 其实我不是这个意思,但也可能是这个原因。这取决于在图像上找到的描述符数量,而不是方向盘。我的意思是这个;如果您的测试图像是方向盘、狗和自行车(全在一张图像中),它将无法工作。我的意思是,它不仅与背景有关,还与方向盘周围的其他部分有关。
    • 好的,说清楚了。这是一个很好的测试图像:upload.wikimedia.org/wikipedia/commons/d/dc/… 吗?
    • 并不完美,它有可能会起作用,但很可能会失败。因为,与白色背景的图像相比,SURF 会在这张图像中找到更多的关键点。因此,您的 BoW 描述符会有所不同。尝试使用训练图像进行测试。
    • 所以这意味着 SVM 在方向盘有车速表和其他东西的背景的真实情况下不会有用?
    猜你喜欢
    • 2015-05-04
    • 2015-07-25
    • 2015-04-18
    • 2015-01-22
    • 2016-07-23
    • 2017-08-25
    • 2015-09-26
    • 2016-10-31
    相关资源
    最近更新 更多