它们在重点检查文字转WAV音频