选的是人在水下动作最缓慢的时候文字转WAV音频