从偶尔可以捕捉到未来的一些模糊片段直接修改成可以预见未来文字转WAV音频