就是根据谢冰自身的条件文字转WAV音频