但问题是如果我们真的不去文字转WAV音频