况且就算是人第一次排队干什么的时候也很难做到统一文字转WAV音频