而是在过程文字转WAV音频