Windows下 Robhess SIFT源码配置

Robhess OpenSIFT 源码下载：传送门

为了进一步学习SIFT，选择论文就着代码看，在VS2013、OpenCV2.4.13下新建项目，跑一跑经典之作。由于将代码和Opencv配置好后还会有些错误提示，所以下面是代码的一些改动之处。（试了下其实还是ubuntu下更方便，因为有许多参数或者命令是linux下的，当然windows下可以进行一些修改后利用）。

大前提：opencv配置好。剩下的都可以通过修改来搞定。

首先看看解压后的文件，我们只需要头文件和源文件：

Windows下 Robhess SIFT源码配置

头文件：6个源文件：10个

注意直接运行肯定不行，因为有几个文件比较特殊，下面对所有头、源文件进行解释：

1）imgfeatures.c 和 imgfeatures.h:

有SIFT特征点结构struct feature的定义，除此之外还有一些特征点的导入导出以及特征点绘制函数的声明，对应的imgfeatures.c文件中是特征点的导入导出以及特征点绘制函数的实现。

2）utils.c 和 utils.h:

这两个文件中是一些图像基本操作的函数，包括：获取某位置的像素点，设置某位置的像素点（8位，32位和64位），计算两点之间的距离的平方，在图片某一点画一个“X”，将两张图片合成为一个(在特征匹配中用到)，高是二者之和，宽是二者的较大者。

3）minpq.c 和 minpq.h：

这两个文件中实现了最小优先级队列(Minimizing Priority Queue)，也就是小顶堆，在k-d树的建立和搜索过程中要用到。

4）kdtree.c 和 kdtree.h：

这两个文件中实现了k-d树的建立以及用BBF(Best Bin First)算法搜索匹配点的函数。如果需要对两个图片中的特征点进行匹配，就要用到这两个文件。

5）xform.c 和 xform.h:

这两个文件中实现了RANSAC算法(RANdom SAmple Consensus 随机抽样一致)。RANSAC算法可用来筛选两个图像间的SIFT特征匹配并计算变换矩阵。可以单利用RANSAC算法筛选两个图像间的SIFT特征匹配，以得到更好的匹配结果，很经典的算法，值得学习。

6）sift.c 和 sift.h:

论文里最主要的内容在此，里面的内容就是两个特征点检测函数sift_features()和 _sift_features()，sift_features()是用默认参数进行特征点检测， _sift_features()允许用户输入各种检测参数，其实sift_features()中也是再次调用_sift_features()函数。所以只需提供原图像和存储特征点的数组以及其他一些检测参数，然后调用sift_features()或 _sift_features()就可完成SIFT特征点检测。

7）siftfeat.c :含有main函数，用来实现特征点的检测，返回特征点数目和标记特征点的图像。（主要用到）

8）match.c : 含有main函数, 检测两张图中的sift特征点，然后找到特征点的匹配对。（主要用到）

9）match_num.c : 含有main函数，检测sift特征点，但是用到了linux下的多线程编程，所以这里暂时不做讨论。

10）dspfeat.c : 含有main函数，可以从预先保存的特征点文件中读取特征点并显示在图片上。

一. 修改代码

第一步：将代码中所有头文件和源文件中的声明改一下：

修改前：

#include <cv.h>
#include <cxcore.h>
#include <highgui.h>

修改后:

#include <opencv/cv.h>
#include <opencv/cxcore.h>
#include <opencv/highgui.h>

修改原因：因为直接利用找不到opencv路径，所以调整路径。

第二步:修改源文件代码：

1. sift.c:

将函数 static IplImage*** build_gauss_pyr( IplImage* base, int octvs, int intvls, double sigma ) 中的代码进行改动：

修改前：

  const int _intvls = intvls;
  double sig[_intvls+3], sig_total, sig_prev, k;

修改后：

  const int _intvls = intvls;
  double *sig = (double*)malloc(sizeof(double)*(_intvls+3)); 
  double sig_total, sig_prev, k;
  ...
  free(sig);   //子函数返回前释放内存

修改原因：

源代码中用变量_intvls+3作为数组的长度，但是VC的编译器不是GCC，它不允许这样做。DEV-C++使用的编译器是GCC，它允许使用变量作为数组的长度定义数组。

当然利用C++中的new或者vector也可以。参考new、delete与malloc、free区别。

2. utils.c

首先删除这两行：

#include <gdk/gdk.h>
#include <gtk/gtk.h>

为啥删掉？

gtk是一个功能强大、设计灵活的一个通用图形库，是GNU/Linux下开发图形界面的应用程序的主流开发工具之一，GTK+也有Windows版本和Mac OS X版。在作者的源码中gtk用来调整窗口来显示图像，因为我懒于装gtk，所以直接利用opencv进行显示，所以这里需要修改一些opencv的东西。

将函数进行改动：

修改前：

 1 void display_big_img( IplImage* img, char* title )
 2 {
 3   IplImage* small;
 4   GdkScreen* scr;
 5   int scr_width, scr_height;
 6   double img_aspect, scr_aspect, scale;
 7 
 8   /* determine screen size to see if image fits on screen */
 9   gdk_init( NULL, NULL );
10   scr = gdk_screen_get_default();
11   scr_width = gdk_screen_get_width( scr );
12   scr_height = gdk_screen_get_height( scr );
13 
14   if( img->width >= 0.90 * scr_width  ||  img->height >= 0.90 * scr_height )
15     {
16       img_aspect = (double)(img->width) / img->height;
17       scr_aspect = (double)(scr_width) / scr_height;
18       
19       if( img_aspect > scr_aspect )
20     scale = 0.90 * scr_width / img->width;
21       else
22     scale = 0.90 * scr_height / img->height;
23 
24       small = cvCreateImage( cvSize( img->width * scale, img->height * scale ),
25                  img->depth, img->nChannels );
26       cvResize( img, small, CV_INTER_AREA );
27     }
28   else
29     small = cvCloneImage( img );
30   
31   cvNamedWindow( title, 1 );
32   cvShowImage( title, small );
33   cvReleaseImage( &small );
34 }

View Code