而且不能确定他们位置文字转WAV音频