然后在第十二层通过某种秘法进行某种融合文字转WAV音频