他们只管按照生产厂家的思路走文字转WAV音频