可以做出像正常人一样的动作来文字转WAV音频