既然是不同族群的人文字转WAV音频