通过他的身形和着装文字转WAV音频