现在所需要的还是培养客户端文字转WAV音频