他的能力可以定位某种状态文字转WAV音频