又从周围抽取文字转WAV音频