并不能用人族的方式去控制文字转WAV音频