它们就会在听到口令的时候文字转WAV音频