不过可以肯定的是绝对不是人类文字转WAV音频