毕竟是要吸收外界文字转WAV音频