当然这也只是一种尽量追求的精确度现实中都很难达到文字转WAV音频