他们可以根据触发条件作出各种反应以及回复不同的句子文字转WAV音频