有一些是依照周围的景文字转WAV音频