还不包括3D技术和动态捕捉技术的前期海量的资金投入文字转WAV音频