好像在判断她言词中的真伪文字转WAV音频