而是有了一个微弱的补充文字转WAV音频