他们的目标并不是首长文字转WAV音频