在引导之前文字转WAV音频