达不到这个目的就只能考虑怎么最圆满的处理好眼前的场面文字转WAV音频