只能看到大概身形和五官文字转WAV音频