他现在似乎可以分辨了文字转WAV音频