d类则面向短片和纪录片文字转WAV音频