而头部以外的部位……需要在二维面层面上有60%以上的身体面积被镜子照到文字转WAV音频