那就是避免我们对他们的人员数量有正确的认知文字转WAV音频