要让他们主动开口文字转WAV音频