他这个构想在可行性和推进速度上我觉得是不是可以再仔细研究评估一下文字转WAV音频