也就是每个参赛者上场演示完自己的骨器后文字转WAV音频