说话间既顾及到了查央文字转WAV音频