Robhess OpenSIFT 源码下载:传送门
为了进一步学习SIFT,选择论文就着代码看,在VS2013、OpenCV2.4.13下新建项目,跑一跑经典之作。由于将代码和Opencv配置好后还会有些错误提示,所以下面是代码的一些改动之处。(试了下其实还是ubuntu下更方便,因为有许多参数或者命令是linux下的,当然windows下可以进行一些修改后利用)。
大前提:opencv配置好。剩下的都可以通过修改来搞定。
首先看看解压后的文件,我们只需要头文件和源文件:
头文件:6个 源文件:10个
注意直接运行肯定不行,因为有几个文件比较特殊,下面对所有头、源文件进行解释:
1)imgfeatures.c 和 imgfeatures.h:
有SIFT特征点结构struct feature的定义,除此之外还有一些特征点的导入导出以及特征点绘制函数的声明,对应的imgfeatures.c文件中是特征点的导入导出以及特征点绘制函数的实现。
2)utils.c 和 utils.h:
这两个文件中是一些图像基本操作的函数,包括:获取某位置的像素点,设置某位置的像素点(8位,32位和64位),计算两点之间的距离的平方,在图片某一点画一个“X”,将两张图片合成为一个(在特征匹配中用到),高是二者之和,宽是二者的较大者。
3)minpq.c 和 minpq.h:
这两个文件中实现了最小优先级队列(Minimizing Priority Queue),也就是小顶堆,在k-d树的建立和搜索过程中要用到。
4)kdtree.c 和 kdtree.h:
这两个文件中实现了k-d树的建立以及用BBF(Best Bin First)算法搜索匹配点的函数。如果需要对两个图片中的特征点进行匹配,就要用到这两个文件。
5)xform.c 和 xform.h:
这两个文件中实现了RANSAC算法(RANdom SAmple Consensus 随机抽样一致)。RANSAC算法可用来筛选两个图像间的SIFT特征匹配并计算变换矩阵。可以单利用RANSAC算法筛选两个图像间的SIFT特征匹配,以得到更好的匹配结果,很经典的算法,值得学习。
6)sift.c 和 sift.h:
论文里最主要的内容在此,里面的内容就是两个特征点检测函数sift_features()和 _sift_features(),sift_features()是用默认参数进行特征点检测, _sift_features()允许用户输入各种检测参数,其实sift_features()中也是再次调用_sift_features()函数。所以只需提供原图像和存储特征点的数组以及其他一些检测参数,然后调用sift_features()或 _sift_features()就可完成SIFT特征点检测。
7)siftfeat.c :含有main函数,用来实现特征点的检测,返回特征点数目和标记特征点的图像。(主要用到)
8)match.c : 含有main函数, 检测两张图中的sift特征点,然后找到特征点的匹配对。(主要用到)
9)match_num.c : 含有main函数,检测sift特征点,但是用到了linux下的多线程编程,所以这里暂时不做讨论。
10)dspfeat.c : 含有main函数,可以从预先保存的特征点文件中读取特征点并显示在图片上。
一. 修改代码
第一步:将代码中所有头文件和源文件中的声明改一下:
修改前:
#include <cv.h> #include <cxcore.h> #include <highgui.h>
修改后:
#include <opencv/cv.h> #include <opencv/cxcore.h> #include <opencv/highgui.h>
修改原因:因为直接利用找不到opencv路径,所以调整路径。
第二步:修改源文件代码:
1. sift.c:
将函数 static IplImage*** build_gauss_pyr( IplImage* base, int octvs, int intvls, double sigma ) 中的代码进行改动:
修改前:
const int _intvls = intvls; double sig[_intvls+3], sig_total, sig_prev, k;
修改后:
const int _intvls = intvls; double *sig = (double*)malloc(sizeof(double)*(_intvls+3)); double sig_total, sig_prev, k;
...
free(sig); //子函数返回前释放内存
修改原因:
源代码中用变量_intvls+3作为数组的长度,但是VC的编译器不是GCC,它不允许这样做。DEV-C++使用的编译器是GCC,它允许使用变量作为数组的长度定义数组。
2. utils.c
首先删除这两行:
#include <gdk/gdk.h>
#include <gtk/gtk.h>
为啥删掉?
gtk是一个功能强大、设计灵活的一个通用图形库,是GNU/Linux下开发图形界面的应用程序的主流开发工具之一,GTK+也有Windows版本和Mac OS X版。在作者的源码中gtk用来调整窗口来显示图像,因为我懒于装gtk,所以直接利用opencv进行显示,所以这里需要修改一些opencv的东西。
将函数进行改动:
修改前:
1 void display_big_img( IplImage* img, char* title ) 2 { 3 IplImage* small; 4 GdkScreen* scr; 5 int scr_width, scr_height; 6 double img_aspect, scr_aspect, scale; 7 8 /* determine screen size to see if image fits on screen */ 9 gdk_init( NULL, NULL ); 10 scr = gdk_screen_get_default(); 11 scr_width = gdk_screen_get_width( scr ); 12 scr_height = gdk_screen_get_height( scr ); 13 14 if( img->width >= 0.90 * scr_width || img->height >= 0.90 * scr_height ) 15 { 16 img_aspect = (double)(img->width) / img->height; 17 scr_aspect = (double)(scr_width) / scr_height; 18 19 if( img_aspect > scr_aspect ) 20 scale = 0.90 * scr_width / img->width; 21 else 22 scale = 0.90 * scr_height / img->height; 23 24 small = cvCreateImage( cvSize( img->width * scale, img->height * scale ), 25 img->depth, img->nChannels ); 26 cvResize( img, small, CV_INTER_AREA ); 27 } 28 else 29 small = cvCloneImage( img ); 30 31 cvNamedWindow( title, 1 ); 32 cvShowImage( title, small ); 33 cvReleaseImage( &small ); 34 }