【问题标题】:Reading input sound signal using Python使用 Python 读取输入声音信号
【发布时间】:2016-05-22 13:01:58
【问题描述】:

我需要从连接了插孔的麦克风获取声音信号,并使用该数据在 Python 中立即进行处理。

处理及后续步骤一目了然。我只是在从程序中获取信号时迷失了方向。 通道数量无关紧要,一个就足够了。我不会播放声音,所以声卡上应该不需要 ASIO。

我的问题是:如何从 Python 中捕获 Jack 音频? (如果有一个包,有据可查的例子,那就太好了:-)。

【问题讨论】:

    标签: python python-2.7 audio soundcard


    【解决方案1】:

    你试过pyaudio吗? 安装:

    python -m pip install pyaudio
    

    录音示例,来自官网:

    PyAudio 示例:录制几秒钟的音频并将其保存到 WAVE 文件中。

    import pyaudio
    import wave
    
    CHUNK = 1024
    FORMAT = pyaudio.paInt16
    CHANNELS = 2
    RATE = 44100
    RECORD_SECONDS = 5
    WAVE_OUTPUT_FILENAME = "output.wav"
    
    p = pyaudio.PyAudio()
    
    stream = p.open(format=FORMAT,
                    channels=CHANNELS,
                    rate=RATE,
                    input=True,
                    frames_per_buffer=CHUNK)
    
    print("* recording")
    
    frames = []
    
    for i in range(0, int(RATE / CHUNK * RECORD_SECONDS)):
        data = stream.read(CHUNK)
        frames.append(data)
    
    print("* done recording")
    
    stream.stop_stream()
    stream.close()
    p.terminate()
    
    wf = wave.open(WAVE_OUTPUT_FILENAME, 'wb')
    wf.setnchannels(CHANNELS)
    wf.setsampwidth(p.get_sample_size(FORMAT))
    wf.setframerate(RATE)
    wf.writeframes(b''.join(frames))
    wf.close()
    

    此示例适用于我的笔记本电脑,在 Windows 8.1 中使用 Python 2.7.11(和 3.5.1),pyaudio 0.2.9。

    【讨论】:

    • 是否可以同时从麦克风录制和播放到扬声器?从编程的角度来看,读取 CHUNK 大小数据后,通过扬声器的流播放。延迟太短,人耳无法察觉。
    【解决方案2】:

    您打算从麦克风中获取音频片段还是流式传输? 无论哪种情况,都可以使用sounddevice

    您可以使用
    pip install sounddevice --user

    安装 python 模块

    API详情请参考官网。

    sounddevice 将从您的笔记本电脑麦克风录制音频(标准音频输入)并在扬声器或耳机上播放(标准音频输出)。您可以使用声音对象进行进一步处理。

    import sounddevice as sd
    import numpy as np
    import scipy.io.wavfile as wav
    
    fs=44100
    duration = 5  # seconds
    myrecording = sd.rec(duration * fs, samplerate=fs, channels=2,dtype='float64')
    print "Recording Audio"
    sd.wait()
    print "Audio recording complete , Play Audio"
    sd.play(myrecording, fs)
    sd.wait()
    print "Play Audio Complete"
    

    这是输出: Python 2.7.9(默认,2014 年 12 月 10 日,12:24:55)[MSC v.1500 32 位(英特尔)] 在 win32 上 键入“copyright”、“credits”或“license()”以获取更多信息。 =================================重新开始================= ==

    录制音频
    录音完成,播放音频
    播放音频完成

    【讨论】:

      【解决方案3】:

      我会考虑使用 pysox,这是 libsox 的 python 绑定。

      你可以从 PyPI 获得pysox package

      【讨论】:

        【解决方案4】:

        如果要求是Jack,那么您可能想要使用PyJack,它是Jack 的Python 绑定。

        此外,源代码中有一个示例说明您想要做什么,即捕获音频。见文件capture.py

        您必须考虑到避免错过一个块,您必须每隔500 *(buffer_size/sample_rate) 毫秒调用一次jack.processjack.process 错过音频块时抛出异常(jack.InputSyncErrorjack.OutputSyncError)。

        【讨论】:

        • 我认为jack 的 OP 意味着实际的音频插孔(不是 USB 或其他),但我可能错了。
        猜你喜欢
        • 1970-01-01
        • 2022-12-23
        • 2022-11-30
        • 2011-07-09
        • 1970-01-01
        • 2010-11-09
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        相关资源
        最近更新 更多