像是在捕捉什么文字转WAV音频