其实是配合对方的表演文字转WAV音频