我们建议采用第一种方案文字转WAV音频