因此为了更加仔细的划分文字转WAV音频