所以这里并不存在双重标准文字转WAV音频