但是他们自动将其过滤了文字转WAV音频