在虚拟屏幕上操作跟在真实屏幕操作上的定位精准度不会有太大区别文字转WAV音频