鉴于大家都说的是方言文字转WAV音频