他也完全不能推演其中万分之一文字转WAV音频