面前的十几个监控画面文字转WAV音频