然后将画面以及它们对应的音效文件分门别类存在一起文字转WAV音频