实际上是内秀的格局文字转WAV音频