和现在的全部类似的能力几乎都是各种功能的混合产物不同文字转WAV音频