因为是多段同时启动文字转WAV音频