似乎在捕捉着周围细小文字转WAV音频