实际上是监控他的一举一动文字转WAV音频