他们完全能够想象文字转WAV音频