最终确定他们在世界中的位置文字转WAV音频