人群围绕的核心地带文字转WAV音频