也就是说他用正确的方式文字转WAV音频