根本就看不到有太多的动作和表情文字转WAV音频