镜头便已经再次转换到了现场文字转WAV音频