【发布时间】:2013-07-18 19:25:41
【问题描述】:
我尝试编写一个可以测试用户发音的程序。
这个程序会播放一个波形声音,说一个英文句子,用户会尝试发音并录制他的声音,程序会检查波形的相似性并指出用户的发音。
问题是,是否可以使用 .net 编写此程序?如果是,我可以使用哪些库?有什么入门指南吗?
【问题讨论】:
标签: .net audio wav waveform phonetics
我尝试编写一个可以测试用户发音的程序。
这个程序会播放一个波形声音,说一个英文句子,用户会尝试发音并录制他的声音,程序会检查波形的相似性并指出用户的发音。
问题是,是否可以使用 .net 编写此程序?如果是,我可以使用哪些库?有什么入门指南吗?
【问题讨论】:
标签: .net audio wav waveform phonetics
音乐识别程序通常表示频谱域中的声音(如捕捉音高)。
根据某些光谱表示,可以使用距离度量(欧几里得或其他)。
对于语音,时间维度是必要的。
在空间域中,考虑时间变形(慢与快)的翘曲测量似乎也是一个不错的选择。
模板匹配算法和 OCR 算法一样可能是很好的候选算法,但现在您需要处理的是声波。
声波算法的一个常见考虑因素是滑动窗口或分割。
【讨论】:
梅苏特!
假设您使用的是 C#.NET,我可能会为您解答。通过简单的 Google 搜索,我找到了这个 YouTube 视频,它向您展示了如何“绘制音频波形”:http://www.youtube.com/watch?v=ZnFoVuOVrUQ
祝你好运,剩下的就看你自己了!
【讨论】: