就想当然认为他们也可以学习文字转WAV音频