他因为依赖系统的提示文字转WAV音频