DTW（动态时间规准）算法，孤立词语音识别

　　转一篇相似度匹配的文章，写得不错！

　　DTW为（Dynamic Time Warping，动态时间归准）的简称。应用很广，主要是在模板匹配中，比如说用于孤立词语音识别，计算机视觉中的行为识别，信息检索等中。可能大家学过这些类似的课程都看到过这个算法，公式也有几个，但是很抽象，当时看懂了但不久就会忘记，因为没有具体的实例来加深印象。

这次主要是用语音识别课程老师上课的一个题目来理解DTW算法。

　　首先还是介绍下DTW的思想：假设现在有一个标准的参考模板R，是一个中号维的向量，即R = {R（1），R（2），......，R（M），......， R（M）}，每个分量可以是一个数或者是一个更小的向量。现在有一个才测试的模板T，是一个ñ维向量，即T = {T（1），T（2）， ......，T（N），......，T（N）}同样每个分量可以是一个数或者是一个更小的向量，注意中号不一定等于N，但是每个分量的维数应该相同。

由于中号不一定等于N，现在要计算ř和Ť的相似度，就不能用以前的欧式距离等类似的度量方法了。那用什么方法呢？DTW就是为了解决这个问题而产生的。

首先我们应该知道- [R中的一个分量R（米）和Ť中的一个分量T（N）的维数是相同的，它们之间可以计算相似度（即距离）。在运用DTW前，我们要首先计算R的每一个分量和T中的每一个分量之间的距离，形成一个M N的矩阵。（为了方便，行数用将标准模板的维数M，列数为待测模板的维数N ）。

然后下面的步骤该怎么计算呢？用个例子来看看。

这个例子中假设标准模板 - [R为字母ABCDEF（6个），测试模板Ť为1234（4个）.R和Ť中各元素之间的距离已经给出如下：

既然是模板匹配，所以各分量的先后匹配顺序已经确定了，虽然不是一一对应的。现在题目的目的是要计算出测试模板Ť和标准模板 - [R之间的距离。因为2个模板的长度不同，所以其对应匹配的关系有很多种，我们需要找出其中距离最短的那条匹配路径现假设题目满足如下的约束：当从一个方格（第（i-1，J-1）或者（ⅰ -1，j）的或者（I，J-1））中到下一个方格（I，J），如果是横着或者竖着的话其距离为d（I，J），如果是斜着对角线过来的则是2D（I，J）其约束条件如下图像所示：