都是来自于中间那段讲述这个故事的世界架构的段落文字转WAV音频