用Python写一个语音播放软件

2023-02-26

功能 text 语音

单位经常使用广播进行临时事项的通知(将文字转换为语音然后通过功放广播)，但是市面上多数语音播放软件都是收费的，要么发音失真，要么不够稳定——经常出现莫名其妙的故障，容易给工作带来被动。学Python这么久不如动手写一款自己的语音广播软件，即使发生故障也可以自行排除。1界面设计在开始动工之前当然要分析

单位经常使用广播进行临时事项的通知(将文字转换为语音然后通过功放广播)，但是市面上多数语音播放软件都是收费的，要么发音失真，要么不够稳定——经常出现莫名其妙的故障，容易给工作带来被动。学Python这么久不如动手写一款自己的语音广播软件，即使发生故障也可以自行排除。

界面设计

在开始动工之前当然要分析需求，我要的核心功能是将一段文字通知输入软件，然后将其转换为语音并播放出来。

这项功能虽然并不复杂，但也需要一个交互式的界面，所以决定使用Tkinter来实现这个功能。

***步:建立一个窗体

设置标题、大小等要素，为了避免显示格式错乱将其设定为不可改变大小，代码如下:

第二步，设置一个控件

用于接受收入的文字，这里选择带滚动条的Text，代码如下：

第三步，提供选项

作为一款语音播放软件，最基本的语速、音调等风格设置还是要有的，这里使用Combobox控件提供固定选项，用户可以根据情况选择不同的发音、语速和语调。

第四步，建立功能事件的触发接口

设置三个Button控件分别用于触发“语音播放”、“文本清除”和“界面退出”功能。

最终界面效果如下：

语音播放

关于“清除”、“退出”等功能相对比较简单，这里重点对本次的核心功能——语音播放进行详细说明。

1).语音接口

文本转换语音推荐使用百度云的REST API 接口，登录网站http://ai.baidu.com/，依次进入控制台——语音技术页面，创建自己的语音应用(下图)，其中AppID 、API Key 、Secret Key 三个参数在代码中会用到。

然后使用 pip install baidu-aip 安装python SDK模块，我们来看一下函数原型:

APP_ID = 'XXXXXX' 
 
API_KEY = 'XXXXXXXXXXXXX' 
 
SECRET_KEY = 'XXXXXXXXXXXXXXXXXXXXXX' 
 
client = AipSpeech(APP_ID, API_KEY, SECRET_KEY) 
 
result  = client.synthesis(text, 'zh', 1, {'per':1, 'vol':15, 'pit':9, 'spd':5 }) 
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.

text:需要转换的文字。
per:发音人选择, 0为女声，1为男声，3为情感合成-度逍遥，4为情感合成-度丫丫，默认为普通女声。vol:音量，取值0-15，默认为5中音量
pit:音调，取值0-9，默认为5中语调。
spd:语速，取值0-9，默认为5中语速。‘zh’和1分别为语音模式和客户端类型，该两项均为固定值，不支持修改。

可以看到，我们需要的发音、音调、语速三种风格都可以通过修改参数来实现。

2).功能设计

解决了语音合成接口的问题，就可以结合界面设置来实现具体功能了。