他需要的是导演中心制的工作模式文字转WAV音频