但他们要做的是银幕发行级别文字转WAV音频