首先是彼此的位置不一样文字转WAV音频