那么前者就是寥寥几页的概括文字转WAV音频