他们没看到之前的经过文字转WAV音频