接受的不是单纯文字转WAV音频