所以最后在确定他们位置的时候文字转WAV音频