他们可能原本是以小队为单位存在文字转WAV音频