而且他要求我们必须满足文字转WAV音频