他们每时每刻都要对不同的场景不同的情况进行模拟文字转WAV音频