但原联还是尽量辨认了文字转WAV音频