会将拍摄到的视频传输到他们这边来文字转WAV音频