gooutlook

 

硬件

http://www.alsrobot.cn/goods-579.html

 

 

 

 

1 usb免驱动语音输入

https://blog.csdn.net/qq_38113006/article/details/105757167

https://blog.csdn.net/Smile_h_ahaha/article/details/106369731

 

安装库

安装 ALSA 的录音应用软件

sudo apt-get -y  install  alsa-utils   pulseaudio

  

 

lsusb命令查看一下USB设备:

 

 

(2)通过[sudo apt-get update]进行源更新。(无外网时可以跳过,如果后面命令执行时出现问题,请返回此步并执行此步和(3)步)

(3)通过[sudo apt-get upgrade]进行包更新。(无外网时可以跳过)

(4)通过[sudo modprobe snd_bcm2835]载入声卡驱动。

(5)通过[arecord -d 10 -D plughw:1,0 test.wav]进行录音测试。(默认保存在/home/test.wav)(命令说明:arecord -d 录制时间(s)-D 设备 名称)

  

 

 

USB声卡的使用

 

arecord -l可以列出所有录音设备

 

 

 

直接执行Linux自带的录音命令,录制一段5秒的声音进行测试

arecord -D "plughw:1,0" -f S16_LE -r 16000 -d 5 -t wav test.wav

  

 其中 hw:1,0 表示card 1 , device 0,即我们的USB声卡,arecord 其他的参数如下:

 

 

 

如果声音过小,输入命令 alsamixer,来对音量进行调整,按下F6,选择USB声卡,

alsamixer

  

 

 

 选择F6

 

 

 

 

 

 然后按下F5,将录音和播音设备都展示出来,因为我的USB声卡只支持录音,所以播音的音量无法调整,我们将录音的音量按上键调高

 

 注意这个声音最好调成0,不然会有严重的电流刺啦声音

 

 然后使用aplay命令来播放,也可以双击使用树莓派自带的媒体软件播放。

aplay -D "plughw:0,0" test.wav

 如果录音有问题,可能是缺少一些录音软件

sudo apt-get install  alsa-utils ulseaudio

 

语音播放

树莓派支持 3.5mm 接口音频输出和 HDMI 音频输出,可以通过 config 界面来进行配置
如下图所示,输入

sudo raspi-config

  声音输出模式配置
(1)选择进入第 7 项 - Advanced Options
(2)选择 Audio,单击回车

 

 

 

 配置声音输出模式
0 - 自动选择
1 - 3.5mm 音频接口输出
2 - HDMI 输出,这种方式一般是在显示器有喇叭的情况下,使用显示器自带的喇叭播放音频
选择播放模式后,使用 TAB 键切换到 OK,然后单击回车确认,就完成了音频输出模式配置
退出配置界面后,SSH终端会显示模式配置成功

插上耳机到输出孔,看是否有声音,没有的话,把输出改成3.5mm

 

测试例程

\'\'\'
功能:
1录音保存wmv
2上传百度语音识别返回结果
\'\'\'
#树莓派4B 使用USB免驱动麦克风保存录音
import json
import subprocess

vioce_path="voice.wav"

def getvoice(vioce_path):  
    print(\'开始语音输入,5秒内说出目标点 红色  绿色  蓝色,之后保持安静!\')
    #arecord -l可以列出所有录音设备 查看板卡号和驱动号
    #vioce_path="voice.wav"
    Audio_drivce="plughw:2,0"#USB面驱动麦克风 板卡2 驱动0
    vioce_time="5" #录制5秒语音
    msg="arecord -D "+Audio_drivce+" -f S16_LE -r 16000 -d "+vioce_time+" -t wav "+vioce_path
    result=subprocess.call(msg, shell=True)#执行 同级目录保存文件
    #print("录音结束")

#getvoice()
    
    
from aip import AipSpeech


def usevoice(vioce_path):
    print(\'开始语音识别,请等待。。。\')
  
    """ 修改成你的百度 APPID AK SK """
  
        
    APP_ID = \'23159731\'
    API_KEY = \'DIQ9g1OKcI4dIyU0xeFoTyK3\'
    SECRET_KEY = \'P9zittbiFGpkmGsMMqGd74tbyG3bcOhp\'
    
    
    client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)

    # 读取文件
    def get_file_content(file_path):
        with open(file_path, \'rb\') as fp:
            return fp.read()
        
    vioce_file=get_file_content(vioce_path)


    \'\'\'
    1536 普通话(支持简单的英文识别) 无标点
    1537 普通话(纯中文识别)       有标点
    1737 英语                   有标点
    \'\'\'
    # 识别本地文件
    Recresult = client.asr(vioce_file, \'wav\', 16000, {
        \'dev_pid\': 1537,  # 默认1537(普通话 输入法模型),dev_pid参数见本节开头的表格
    })

    jsonRec=json.loads(json.dumps(Recresult))


    #print(jsonRec)
    #for i in jsonRec:
    #    print(i)
    VoiceRuselt=jsonRec["result"][0]
    print("识别结果为:  "+VoiceRuselt)
    

    if VoiceRuselt=="红色。":     #返回结果默认加了句号
        print(\'到达红色区域停止\')    
        return "red"
    elif VoiceRuselt=="蓝色。":
        print(\'到达蓝色区域停止\')
        return "blue"       
    elif VoiceRuselt=="绿色。":
        print(\'到达绿色区域停止\')
        return "green"
    else:
        print(\'没有匹配结果,请重新识别\')
        return "black"
\'\'\'
#1录音 5秒
getvoice(vioce_path)
#2对录音结果识别  vioceresult保存结果   
vioceresult=usevoice(vioce_path)
print(vioceresult)
\'\'\'

  

 

 

三、PyAudio安装即配置

如果需要使用python程序控制录音

安装

pip install pyaudio
pip install tqdm

  

sudo apt-get install libasound-dev portaudio19-dev libportaudio2 libportaudiocpp0 pulseaudio
sudo apt-get install libatlas-base-dev alsa-utils alsa-tools alsa-tools-gui alsamixergui -y

 

 

分类:

技术点:

相关文章: