实际上他大部分的精力还是要放在对周边环境的掌控上的文字转WAV音频