【发布时间】:2020-11-02 22:53:34
【问题描述】:
我正在尝试在通过 ssh 运行 ubuntu 20.04.1 LTS 的机器上使用 Text To Speech 程序 balabolka 和命令行版本 Balcon。 首先我从http://www.cross-plus-a.com/fr/bconsole.htm 下载了balcon,然后经过一些研究,我设法让它工作,这需要安装Wine、winetricks、微软speechPlatformRuntime、speechsdk 和msxml6。我还安装了一些 SAPI 5 TTS 语音。我按照https://askubuntu.com/questions/1189046/wine-how-to-use-sapi-5-voices-for-tts-application-balabolka中描述的步骤进行操作
我在测试时使用这个命令行:WINEPREFIX="$HOME/prefix32" wine "$HOME/prefix32/drive_c/Program Files/balcon/balcon/balcon.exe" -f text.txt -n Daniel_Full_22kHz -w audiooutput.wav
当直接在主机上运行时,此命令可以完美运行,但是我的目标是通过 ssh 从另一台机器上运行此命令。出于测试目的,我尝试直接从 Windows 命令行进行 ssh 连接,也使用 python + paramiko。
这是奇怪的部分:重新启动 Ubuntu 机器后,使用上述任何方法的第一次尝试都会成功,但随后的尝试总是失败。
使用直接 ssh 连接时出现以下错误:
~$ WINPREFIX="$HOME/prefix32" wine "$HOME/prefix32/drive_c/Program Files/balcon/balcon/balcon.exe " -f text.txt -n Daniel_Full_22kHz -w audiooutput.wav 0009:err:winediag:nodrv_CreateWindow 应用程序试图创建一个窗口,但无法加载驱动程序。 0009:err:winediag:nodrv_CreateWindow 确保您的 X 服务器正在运行并且 $DISPLAY 设置正确。 0009:err:ole:CoGetClassObject 类 {d941651c-44e6-4c17-badf-c36826fc3424} 未注册 0009:err:ole:create_server 类 {d941651c-44e6-4c17-badf-c36826fc3424} 未注册 0009:err:ole:CoGetClassObject 不能为上下文 0x5 创建类对象 {d941651c-44e6-4c17-badf-c36826fc3424} 0009:err:ole:CoGetClassObject 类 {cb96b400-c743-11cd-80e5-00aa003e4b50} 未注册 0009:err:ole:CoGetClassObject 类 {cb96b400-c743-11cd-80e5-00aa003e4b50} 未注册 0009:err:ole:create_server 类 {cb96b400-c743-11cd-80e5-00aa003e4b50} 未注册 0009:err:ole:CoGetClassObject 不能为上下文 0x7 创建类对象 {cb96b400-c743-11cd-80e5-00aa003e4b50} 错误:未选择语音
该错误表明 $DISPLAY 环境变量存在问题。使用echo $DISPLAY我发现ssh控制台中没有设置变量,所以我使用export DISPLAY=:0设置它的值:0是通过在ubuntu ssh服务器上运行echo $DISPLAY localy获得的。在此修改之后,所有后续尝试都可以正常工作。
我尝试使用 python+paramiko 做同样的事情,这是我的脚本:
import os
import shell
import paramiko
def connectSSH(key,host,user):
c = paramiko.SSHClient()
c.set_missing_host_key_policy(paramiko.AutoAddPolicy())
print("connecting")
c.connect( hostname = host, username = user, pkey = k )
ftp_client = c.open_sftp()
print("connected")
filet = open("./text.txt","w")
filet.write("Hi this is a text to speech test with daniel voice")
filet.close()
ftp_client.put("./text.txt","./text.txt")
env_dict = {"DISPLAY":":0"}
cmd = "WINPREFIX=\"$HOME/prefix32\" wine \"$HOME/prefix32/drive_c/Program Files/balcon/balcon/balcon.exe \" -f %s -n %s -w %s" % ("kesra2.txt", "Daniel_Full_22kHz","audiooutput.wav")
print(cmd)
stdin,stdout,stderr=c.exec_command(cmd,environment=env_dict)
print(stdout.readlines())
print(stderr.readlines())
ftp_client.get("audiooutput.wav","audiooutput.wav")
ftp_client.close()
起初我遇到了同样的 $DISPLAY 错误,所以我使用env_dict = {"DISPLAY":":0"} 添加它并允许在服务器 sshd 配置上修改此变量,但现在我总是收到错误:
0009:err:ole:CoGetClassObject 类 {d941651c-44e6-4c17-badf-c36826fc3424} 未注册 0009:err:ole:create_server 类 {d941651c-44e6-4c17-badf-c36826fc3424} 未注册 0009:err:ole :CoGetClassObject 没有类对象 {d941651c-44e6-4c17-badf-c36826fc3424} 可以为上下文创建 0x5 0009:err:ole:CoGetClassObject 类 {cb96b400-c743-11cd-80e5-00aa003e4b50} 未注册 0009:err:ole:CoGetClassObject类 {cb96b400-c743-11cd-80e5-00aa003e4b50} 未注册 0009:err:ole:create_server 类 {cb96b400-c743-11cd-80e5-00aa003e4b50} 未注册 0009:err:ole:CoGetClassObject 无类对象 {cb96b400-c743-可以为上下文 0x7 创建 11cd-80e5-00aa003e4b50} 错误:未选择语音
错误Error: voice not selected 的最后一部分并不重要,因为相同的 cmd 在其他情况下也有效,其他的东西失败了,但我找不到。另外我不明白为什么无论使用哪种方法(ssh 控制台或 python + paramiko),重新启动服务器后的第一次尝试都可以正常工作
我尝试使用 paramiko 的 invokeshell() 得到相同的结果
任何帮助将不胜感激
【问题讨论】: