大概是上面怕他们知道太多会在表情和言语中提前暴露文字转WAV音频