但他说话的时候众人全都会听文字转WAV音频