似乎在判定他说话的真伪文字转WAV音频