而且他明明记得文字转WAV音频