但是因为第二轮的总人数是一个单数文字转WAV音频