得分是根据每个人在里面的表现文字转WAV音频