【发布时间】:2015-12-08 20:34:08
【问题描述】:
我有一个方形阅读器,它具有我试图通过网络浏览器阅读的音频输出。我使用getUserMedia 从麦克风获取音频流,并使用网络音频 API 获取数据。我的问题是我发现的所有教程都提到使用数据流来显示音频流的视觉效果。在我的实现中,我需要能够区分刷卡声音和背景噪音。
我有几个基本问题:
- 什么是 FFT 大小?我知道它是 Fast Fourier Ttransform,但我不知道它与我正在做的事情有什么关系。
- 我了解缓冲区大小,但我怎么知道我的缓冲区应该有多大?
- 我见过很多关于左右音频的事情。为简单起见,我假设方形阅读器只有一个频道,这是正确的吗?
最后,最重要的问题是,如何将它们组合在一起,以便读取包含方形滑动数据的帧?我有这个资源,但我没有从流分析器的频率或时间数据值中获取 1 和 0 的数据。
This link 有更多关于需要做什么的信息,但在我以字节形式获取数据之前我无法做到。
【问题讨论】:
标签: html audio html5-audio web-audio-api getusermedia