气氛以及画面造型特征来灵活地处理镜头的长度与剪接文字转WAV音频