不是采用每组一份表演文本文字转WAV音频