但是每个人的轻重标准不一样文字转WAV音频