直到看到四周的环境文字转WAV音频