他会根据任务的难易程度文字转WAV音频