所陈述的是推论文字转WAV音频