【问题标题】:Process real time audio without compiling using pyaudio无需使用 pyaudio 编译即可处理实时音频
【发布时间】:2021-01-19 22:00:39
【问题描述】:

我想做实时音频分类,分类程序运行良好。

我试图直接从流中提取数据。但是,我意识到从流媒体输入的数据格式和我们从录制文件加载的数据格式是不一样的。我不知道如何直接从流中处理数据而不记录并再次加载文件。

有人可以帮我解决这个问题吗?

我正在使用 pyaudio 库进行流式传输

FORMAT = pyaudio.paInt16 
        CHANNELS = 1
        RATE = 44100
        CHUNK = 1024
        RECORD_SECONDS = 5
        former_name = "test"
        WAVE_OUTPUT_FILENAME = "audio.wav"


        audio = pyaudio.PyAudio()


        stream = audio.open(format=FORMAT, channels=CHANNELS,
                        rate=RATE, input=True,
                        frames_per_buffer=CHUNK)
        # print ("recording...")

        frames = []

        for i in range(0, int(RATE / CHUNK * RECORD_SECONDS)):
            data = stream.read(CHUNK)
            frames.append(data)

【问题讨论】:

    标签: python audio streaming real-time pyaudio


    【解决方案1】:

    试试这个对我有用

    如果您有 WINDOWS 操作系统,请先安装这个:- pip install pyttsx3 或如果您有 MAC 操作系统:- pip3 install pyttsx3

    import pyttsx3
    
    def voicePlay(string):
    
        engine = pyttsx3.init()
        engine.say(f"{string}") 
        try:
            engine.runAndWait()
        except Exception as e:
            pass
        engine.runAndWait()
    

    【讨论】:

    • 这是一个文本到语音的转换库,我想在不编译音频的情况下实时处理音频
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2012-03-10
    • 2013-09-17
    • 1970-01-01
    • 2015-07-18
    • 2017-08-02
    • 1970-01-01
    相关资源
    最近更新 更多