确定了他们的位置之后再跟上去文字转WAV音频