然后在诸多视线的聚焦下文字转WAV音频