而是可以感觉出来一段粗一段细一段粗一段细的从头到尾被分成了粗细不等的四段文字转WAV音频