完全使用表演捕捉技术来完成文字转WAV音频