他们都是些当地人文字转WAV音频