他考虑的更多的是战斗本身文字转WAV音频