所以他用的是别的方法文字转WAV音频