重要的是根据之前情况判断文字转WAV音频