而是直接说出了重点文字转WAV音频