他们在交谈时已经刻意控制了音量文字转WAV音频