系统在这里安排了一个十分简单的推理文字转WAV音频