代表用户的原生文字转WAV音频