因为要缩小存在感文字转WAV音频