尽管他们掌握了主动文字转WAV音频