而后经过不断的筛选文字转WAV音频