但掌握的也只是皮毛文字转WAV音频