然后才能确定下来之前的方案能不能用文字转WAV音频