一些耗资巨大的情节使用缩小比例的模型拍摄文字转WAV音频