但是我依旧可以看到他们的面部表情文字转WAV音频