对于对面的几个人的表现文字转WAV音频