周围的人则是自动分开文字转WAV音频