在训练过程中把实在不行的再淘汰文字转WAV音频