我不会用这样的方式来解释文字转WAV音频