还是能够依稀分辨出文字转WAV音频