一方面也是因为他们对于自己目前的情况没有一个准确的预估文字转WAV音频