其实就是对方想要监视的对象文字转WAV音频