因为她每次一开口文字转WAV音频