也就是说外界过去了1秒钟文字转WAV音频