他们自然是可以分辨出来的文字转WAV音频