他们一般都是会选择在比较快的时间内给出反应文字转WAV音频