无非也只是多出了一种新思路而已――而且这种深度定制的模式还很难移植到公共电视台或大屏幕上文字转WAV音频