因为它无法离开两仪空间文字转WAV音频