上个博文中采用的hop_size=frame_size*3/4,这个效果如图:第一个是没有overlap

OLA端点问题实际应用效果

OLA端点问题实际应用效果

第二个图是OLA后的图,看起来比较好,但是听起来还是有杂声啊。。。我去,人生艰难啊。。。

而且处理时间是原来的3倍了,卧槽,这个不能忍啊。首先要确认,到底是不是分帧处理产生的,或者还是声音处理没做好?

实际应用中不可能那么大的hopsize,最多一半已经够了,不然没法玩。

 

另外有相关问题可以加入QQ群讨论,不设微信群

QQ群:868373192 

语音深度学习群

相关文章:

  • 2021-09-18
  • 2021-09-14
  • 2021-04-08
  • 2021-05-25
  • 2022-01-29
  • 2022-01-11
猜你喜欢
  • 2021-08-14
  • 2022-12-23
  • 2022-12-23
  • 2021-09-09
  • 2022-12-23
  • 2021-08-23
  • 2021-10-23
相关资源
相似解决方案