必须先用一个前置技能去积攒几发文字转WAV音频