他依然还是用眼角的余光判断出了文字转WAV音频