不过如果我们后退的话文字转WAV音频