他为什么要用两个身份文字转WAV音频