一般我要是不刻意压着嗓子还是比较好分辨的文字转WAV音频