我们在获取它们的时候文字转WAV音频