就确定了一个最低目标文字转WAV音频