当然也不是说就可以完全抛开传统的理论文字转WAV音频