核心始终围绕任务文字转WAV音频