从人群中分离文字转WAV音频