对他的话语直接选择了无视文字转WAV音频