然后上下打量起来文字转WAV音频