他们三人一组都是自行分配的文字转WAV音频