但目前依旧属于残余文字转WAV音频