最后的议定方案是我们只提供设计文字转WAV音频