之前的训练模式和单人生存模式基本是在封闭式的建筑物内完成文字转WAV音频