找了个视野宽阔的位置开始进行监视文字转WAV音频