所以经过这样推理文字转WAV音频