如果一方出现偏差的话文字转WAV音频