便大大的增加了这训练的难度文字转WAV音频