他们的目标应该是安吉拉文字转WAV音频