若不注意很难捕捉文字转WAV音频