而官方给他的定位很简单文字转WAV音频