建议还是保持文字转WAV音频