就是不断的模仿和学习他们的一言一行文字转WAV音频