他们基本不算是跟踪文字转WAV音频