而且客人的分量比较的重文字转WAV音频