剩下的就是简单的计算文字转WAV音频