【发布时间】:2017-04-03 09:23:07
【问题描述】:
我正在研究说话人识别,发现this post on stackoverflow.com 非常有用。
虽然代码运行良好,但我只是有点怀疑:
答案中给出的代码
fRate = 0.010 * fs;
....
writehtk(featureFilename, mfc', 100000, 9);
来自 Voicebox 的函数writehtk
function writehtk(file,d,fp,tc)
%WRITEHTK write data in HTK format []=(FILE,D,FP,TC)
%
% Inputs:
% FILE = name of file to write (no default extension)
% D = data to write: one row per frame
% FP = frame period in seconds
% TC = type code = the sum of a data type and (optionally) one or more of the listed modifiers
writehtk 函数需要以秒为单位的帧周期,但在代码中单位是别的东西。
谁能解释一下这个值是怎么得到的?
【问题讨论】: