并且尽可能控制情况文字转WAV音频