大致猜到了双方的身份文字转WAV音频