直接把二十多米之内的情景映入了脑海文字转WAV音频