所以他们并没有经过实践文字转WAV音频