只是稍稍控制总数文字转WAV音频