如果他建立出整个世界的模型文字转WAV音频